Midjourney prezentuje V1 Video: Pierwszy model generowania wideo AI

Midjourney oficjalnie zaprezentowało swoje pierwsze narzędzie do generowania wideo AI, V1 Video Model, co oznacza znaczącą ekspansję jego możliwości twórczych poza statyczne obrazy. Funkcja jest teraz dostępna dla wszystkich użytkowników subskrypcji i umożliwia im generowanie 5-sekundowych animowanych klipów wideo z pojedynczego nieruchomego obrazu, z opcjonalnymi podpowiedziami tekstowymi do kierowania ruchem i stylem.

Główne cechy modelu wideo V1

Animacja obrazu do wideo: Użytkownicy mogą przesłać własny obraz lub użyć istniejącego obrazu wygenerowanego przez Midjourney, aby wyprodukować cztery 5-sekundowe warianty wideo. Animacje ożywiają statyczne wizualizacje, wykorzystując płynny ruch kamery i obiektów.
Możliwość wydłużenia czasu odtwarzania:Początkowe klipy mają długość 5 sekund, ale użytkownicy mogą wydłużyć każdy film o cztery dodatkowe 4-sekundowe odcinki, maksymalnie do 20–21 sekund.
Tryby ruchu:
Niski ruch: Subtelne efekty dla scen w większości statycznych.
Wysoki ruch: Przeznaczony do scen z dużymi ruchami kamery lub postaci.
Niestandardowe podpowiedzi:Ruch może być sterowany za pomocą komunikatów tekstowych, umożliwiając użytkownikom dyktowanie ruchów kamery, akcji obiektów lub przejść.
Dwa style animacji:
Tryb automatyczny:Automatycznie generuje animację z obrazu.
Tryb ręczny:Umożliwia szybką edycję przed renderowaniem animacji.

Wizja wykraczająca poza krótkie klipy

Prezes Midjourney David Holz stwierdził, że ten model nie polega tylko na tworzeniu stylowych materiałów B-roll lub reklam. Stanowi on kluczowy krok w kierunku długoterminowego celu firmy: zbudowania systemu symulacji otwartego świata w czasie rzeczywistym, opartego na sztucznej inteligencji. Ta ambitna wizja obejmuje:

W pełni interaktywna przestrzeń 3D, w której użytkownicy mogą się swobodnie poruszać.
Renderowanie obrazu i reakcja sceny w czasie rzeczywistym.
Dynamiczne postacie i otoczenie reagujące na działania użytkownika.

Aby to osiągnąć, Midjourney wdraża swoje podstawowe komponenty etapami:

Generowanie obrazu (zakończone)
Animacja wideo (uruchomiona)
Interakcja 3D (w trakcie opracowywania)
Optymalizacja renderowania w czasie rzeczywistym (planowana)

Użyteczność i cena

Dostęp do subskrypcji:Model V10, w cenie 1 USD miesięcznie, jest pozycjonowany jako niezwykle przystępne narzędzie kreatywne dla artystów i twórców treści.
Koszt renderowania:Partia 20 dłuższych klipów (łącznie ok. 80 sekund) pochłania około jednej „szybkiej godziny”, co kosztuje około 4 USD — jest to niższa stawka w porównaniu do konkurencyjnych rozwiązań, takich jak Google Veo 3.
Jakość wideo: Choć nie przewyższa znacząco rywali, takich jak Dream Machine Luma Labs, Midjourney utrzymuje wysoki poziom wierności wizualnej. Każda klatka przypomina cyfrowy obraz o kinowej estetyce.

Ograniczenia

Brak obsługi audio:W przeciwieństwie do Veo 3 czy Dream Machine, model Midjourney nie generuje obecnie ścieżek dźwiękowych ani dźwięków otoczenia.
Ograniczenia edycji: Edycja osi czasu, przejścia scen i łączenie segmentów nie są dostępne.
Czas renderowania:Prędkość generacji może nieznacznie odbiegać od wyników konkurencji w przypadku bardziej złożonych scen.

Środowisko konkurencyjne

Midjourney wkracza na zatłoczony rynek, na którym znajdują się również Runway, Luma Labs, Google Veo 3 i MiniMax Hailuo 02.

Silne strony:

Bezproblemowa integracja z procesem generowania obrazów Midjourney.
Intuicyjny interfejs użytkownika i ekonomiczny dostęp.
Idealny do eksperymentalnych treści krótkich.

Słabości:

Brak dźwięku.
Ograniczony montaż i czas trwania sceny.
Stała rozdzielczość 480p (standardowa rozdzielczość).

Jak generować filmy

Dołącz do Discorda Midjourney: Upewnij się, że jesteś na kanale, na którym aktywny jest Midjourney Bot. Jeśli nie, dodaj bota do swojego serwera lub dołącz do oficjalnego serwera Midjourney.
Wywołaj polecenie wideo: Użyj /imagine polecenie z opisem i dołącz --video parametr. Na przykład:

   /imagine “a floating lantern drifting over a serene lake at sunset” --video

Dostosuj czas trwania (opcjonalnie):Domyślnie V1 generuje klip trwający 10 sekund, ale możesz dostosować jego długość do 20 sekund za pomocą --duration. Np:

   /imagine “city skyline at dawn” --video --duration 20s

Oczekiwanie na generację: Bot przetwarza Twoje żądanie i dostarcza plik wideo lub link. Czas przetwarzania może się różnić w zależności od obciążenia serwera i poziomu subskrypcji.
Pobierz lub udostępnij:Po wygenerowaniu kliknij podany link, aby obejrzeć, pobrać lub udostępnić swój film na różnych platformach.

Zgodność i bezpieczeństwo

Midjourney stosuje ścisłe wytyczne:

Można przesyłać wyłącznie zdjęcia objęte prawem do ich wykorzystania.
Zabrania się tworzenia treści obraźliwych, pornograficznych lub podżegających, zwłaszcza z udziałem prawdziwych osób.
System automatycznie filtruje naruszenia bez obciążania procesora graficznego.

Ta premiera oznacza poważny krok Midjourney w stronę generowania wideo i stanowi podstawę dla szerszych ambicji w interaktywnych światach AI. Chociaż nie jest to jeszcze pełny pakiet do tworzenia filmów, prezentuje przystępne i wizualnie atrakcyjne narzędzie do tworzenia krótkich form.

Użyj MidJourney w CometAPI

CometAPI zapewnia dostęp do ponad 500 modeli AI, w tym modeli multimodalnych typu open source i specjalistycznych dla czatu, obrazów, kodu i innych. Jego główna siła polega na uproszczeniu tradycyjnie złożonego procesu integracji AI.

Interfejs API Comet zaoferuj cenę znacznie niższą od oficjalnej, aby ułatwić Ci integrację API w trakcie podróży oraz Interfejs API wideo Midjourney, a możesz wypróbować go za darmo na swoim koncie po zarejestrowaniu się i zalogowaniu! Zapraszamy do rejestracji i wypróbowania CometAPI.CometAPI płaci za użytkowanie.

Użyj v7 do utworzenia obrazu: Przed użyciem MidJourney V7 do utworzenia obrazu należy rozpocząć tworzenie CometAPI już dziś – zarejestruj się tutaj, aby uzyskać bezpłatny dostęp. Proszę odwiedzić docsRozpoczęcie pracy z MidJourney V7 jest bardzo proste — wystarczy dodać --v 7 parametr na końcu twojego monitu. To proste polecenie mówi CometAPI, aby użył najnowszego modelu V7 do wygenerowania twojego obrazu.

Generowanie wideo: Programiści mogą integrować generowanie wideo za pośrednictwem interfejsu API RESTful. Typowa struktura żądania (ilustracyjna)

curl --
location 
--request POST 'https://api.cometapi.com/mj/submit/video' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'