Midjourney presenta il video V1: il primo modello di generazione video AI

Midjourney ha presentato ufficialmente il suo primo strumento di generazione video basato sull'intelligenza artificiale, il V1 Video Model, che segna un'espansione significativa delle sue capacità creative, andando oltre le immagini statiche. La funzionalità è ora disponibile per tutti gli utenti abbonati e consente loro di generare videoclip animati di 5 secondi a partire da una singola immagine fissa, con prompt di testo opzionali per guidare il movimento e lo stile.

Caratteristiche principali del modello video V1

Animazione da immagine a video: Gli utenti possono caricare la propria immagine o utilizzarne una generata da Midjourney per produrre quattro varianti video da 5 secondi. Le animazioni danno vita a elementi visivi statici utilizzando movimenti fluidi di telecamera e oggetti.
Tempo di riproduzione estensibile: Le clip iniziali durano 5 secondi, ma gli utenti possono estendere ogni video di altri quattro incrementi di 4 secondi, fino a un massimo di 20-21 secondi.
Modalità di movimento:
Basso movimento: Effetti sottili per scene per lo più statiche.
Movimento elevato: Progettato per scene con significative panoramiche della telecamera o movimenti dei personaggi.
Prompt personalizzati: Il movimento può essere guidato da prompt di testo, consentendo agli utenti di dettare i movimenti della telecamera, le azioni degli oggetti o le transizioni.
Due stili di animazione:
Auto Mode: Genera automaticamente l'animazione dall'immagine.
Modalità manuale: Consente la modifica rapida prima del rendering dell'animazione.

Una visione che va oltre le brevi clip

Il CEO di Midjourney, David Holz, ha affermato che questo modello non si limita a creare contenuti extra o pubblicità accattivanti. Rappresenta un passo fondamentale verso l'obiettivo a lungo termine dell'azienda: costruire un sistema di simulazione open-world in tempo reale, basato sull'intelligenza artificiale. Questa ambiziosa visione include:

Uno spazio 3D completamente interattivo in cui gli utenti possono muoversi liberamente.
Rendering delle immagini e risposta della scena in tempo reale.
Personaggi e ambienti dinamici che rispondono alle azioni dell'utente.

Per raggiungere questo obiettivo, Midjourney sta implementando i suoi componenti fondamentali in fasi:

Generazione di immagini (completata)
Animazione video (lanciata)
Interazione 3D (in fase di sviluppo)
Ottimizzazione del rendering in tempo reale (pianificata)

Usabilità e prezzi

Accesso all'abbonamento: Al prezzo di 10 $ al mese, il modello V1 si posiziona come uno strumento creativo altamente accessibile per artisti e creatori di contenuti.
Costo di rendering: Una serie di 20 clip estese (~80 secondi in totale) consuma circa un'“ora veloce”, con un costo di circa 4 $, una tariffa inferiore rispetto a concorrenti come Veo 3 di Google.
Qualità video: Pur non superando significativamente rivali come Dream Machine di Luma Labs, Midjourney mantiene un alto livello di fedeltà visiva. Ogni fotogramma assomiglia a un dipinto digitale con un'estetica cinematografica.

Limiti

Nessun supporto audio:A differenza di Veo 3 o Dream Machine, il modello di Midjourney attualmente non genera colonne sonore o audio ambientale.
Vincoli di modifica: Non sono disponibili modifiche alla timeline, transizioni di scena o collegamenti di segmenti.
Tempo di rendering:La velocità di generazione potrebbe essere leggermente inferiore a quella dei concorrenti quando si tratta di scene complesse.

Panorama competitivo

Midjourney entra in un campo affollato che include Runway, Luma Labs, Veo 3 di Google e Hailuo 02 di MiniMax.

Punti di forza:

Integrazione perfetta con il flusso di lavoro di generazione delle immagini di Midjourney.
Interfaccia utente intuitiva e accesso conveniente.
Ideale per contenuti sperimentali di breve durata.

Punti di debolezza:

Nessun audio.
Montaggio e durata delle scene limitati.
Risoluzione fissa a 480p (definizione standard).

Come generare video

Unisciti alla Discord di metà viaggio: Assicurati di essere in un canale in cui il bot di Midjourney è attivo. In caso contrario, aggiungi il bot al tuo server o unisciti al server ufficiale di Midjourney.
Richiama il comando video: Utilizzare il /imagine comando con il prompt descrittivo, aggiungendo il --video parametro. Per esempio:

   /imagine “a floating lantern drifting over a serene lake at sunset” --video

Personalizza la durata (facoltativo): Per impostazione predefinita, V1 produce una clip di 10 secondi, ma è possibile regolare la lunghezza fino a 20 secondi con --duration. Per esempio:

   /imagine “city skyline at dawn” --video --duration 20s

Aspetta la generazione: Il bot elabora la tua richiesta e invia un file video o un link. I tempi di elaborazione possono variare in base al carico del server e al livello di abbonamento.
Scarica o condividi: Una volta generato, clicca sul link fornito per visualizzare, scaricare o condividere il tuo video sulle piattaforme.

Conformità e sicurezza

Midjourney applica linee guida rigorose:

Possono essere caricate solo immagini con diritti di utilizzo legali.
È vietato generare contenuti offensivi, pornografici o incitanti, in particolare se coinvolgono persone reali.
Il sistema filtra automaticamente le violazioni senza addebitare tempo GPU.

Questo lancio segna il deciso ingresso di Midjourney nella generazione di contenuti video e getta le basi per le sue più ampie ambizioni nel mondo dell'intelligenza artificiale interattiva. Pur non essendo ancora una suite completa per la produzione cinematografica, rappresenta uno strumento accessibile e visivamente accattivante per la creatività in formato breve.

Utilizzare MidJourney in CometAPI

CometAPI fornisce accesso a oltre 500 modelli di intelligenza artificiale, inclusi modelli multimodali open source e specializzati per chat, immagini, codice e altro ancora. Il suo punto di forza principale risiede nella semplificazione del processo di integrazione dell'intelligenza artificiale, tradizionalmente complesso.

CometaAPI offrire un prezzo molto più basso del prezzo ufficiale per aiutarti a integrare API di metà viaggio e al API video di Midjourney, e puoi provarlo gratuitamente nel tuo account dopo esserti registrato e aver effettuato l'accesso! Benvenuto, registrati e prova CometAPI. CometAPI paga a consumo.

Utilizzare v7 per creare l'immagine: Prima di utilizzare MidJourney V7 per creare l'immagine, è necessario iniziare a costruire su CometAPI oggi – registrati qui per l'accesso gratuito. Si prega di visitare docsIniziare con MidJourney V7 è molto semplice: basta aggiungere --v 7 parametro alla fine del prompt. Questo semplice comando dice a CometAPI di usare l'ultimo modello V7 per generare la tua immagine.

Generazione video: Gli sviluppatori possono integrare la generazione di video tramite API RESTful. Una tipica struttura di richiesta (a titolo esemplificativo)

curl --
location 
--request POST 'https://api.cometapi.com/mj/submit/video' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'