Midjourney, 최초의 AI 비디오 생성 모델인 V1 비디오 공개

Midjourney가 첫 AI 비디오 제작 도구인 V1 비디오 모델을 공식 출시했습니다. 이는 정적 이미지를 넘어 창의적인 역량을 크게 확장한 것입니다. 이 기능은 이제 모든 구독 사용자에게 제공되며, 단일 정지 이미지로 5초 분량의 애니메이션 비디오 클립을 제작할 수 있으며, 동작과 스타일을 위한 텍스트 프롬프트도 선택적으로 제공됩니다.

V1 비디오 모델의 주요 기능

이미지-비디오 애니메이션: 사용자는 직접 이미지를 업로드하거나 Midjourney에서 생성한 기존 이미지를 사용하여 5초짜리 비디오 버전 XNUMX개를 제작할 수 있습니다. 애니메이션은 부드러운 카메라 움직임과 객체 움직임을 통해 정적인 영상에 생동감을 불어넣습니다.
확장 가능한 재생 시간: 초기 클립은 5초 길이이지만, 사용자는 각 비디오를 4초씩 20번 늘려서 최대 21~XNUMX초까지 늘릴 수 있습니다.
모션 모드:
낮은 동작: 대부분 정적인 장면에 미묘한 효과를 줍니다.
하이 모션: 카메라 팬이나 캐릭터 움직임이 많은 장면을 위해 디자인되었습니다.
사용자 정의 프롬프트: 텍스트 프롬프트를 통해 동작을 안내할 수 있으므로 사용자가 카메라 움직임, 객체 동작 또는 전환을 지시할 수 있습니다.
두 가지 애니메이션 스타일:
자동 모드: 이미지에서 자동으로 애니메이션을 생성합니다.
수동 모드: 애니메이션 렌더링 전에 즉각적인 편집이 가능합니다.

짧은 클립을 넘어선 비전

Midjourney CEO 데이비드 홀츠는 이 모델이 단순히 스타일리시한 B-롤이나 광고를 만드는 데 그치지 않는다고 밝혔습니다. 이는 회사의 장기적인 목표, 즉 실시간 AI 기반 오픈월드 시뮬레이션 시스템 구축을 향한 중요한 발걸음이라고 할 수 있습니다. 이 야심찬 비전은 다음과 같은 내용을 담고 있습니다.

사용자가 자유롭게 움직일 수 있는 완벽한 상호작용형 3D 공간입니다.
실시간 이미지 렌더링 및 장면 반응.
사용자의 행동에 반응하는 역동적인 캐릭터와 환경.

이를 달성하기 위해 Midjourney는 기본 구성 요소를 단계적으로 출시하고 있습니다.

이미지 생성(완료)
비디오 애니메이션(출시)
3D 상호작용(개발 중)
실시간 렌더링 최적화(계획됨)

사용성 및 가격

구독 액세스: 월 10달러의 가격으로 판매되는 V1 모델은 아티스트와 콘텐츠 제작자에게 접근성이 높은 창작 도구로 자리매김했습니다.
렌더링 비용: 20개의 확장 클립(총 80초 정도)을 묶는 데는 약 4시간(빠른 시간)이 소요되며 비용은 약 3달러입니다. 이는 Google의 Veo XNUMX와 같은 경쟁 제품에 비해 낮은 비용입니다.
비디오 화질: Luma Labs의 Dream Machine과 같은 경쟁작들을 크게 능가하지는 않지만, Midjourney는 높은 수준의 시각적 충실도를 유지합니다. 각 프레임은 영화적인 미학을 지닌 디지털 페인팅과 같습니다.

제한 사항

오디오 지원 안함: Veo 3나 Dream Machine과 달리 Midjourney의 모델은 현재 사운드트랙이나 주변 오디오를 생성하지 않습니다.
편집 제약: 타임라인 편집, 장면 전환, 세그먼트 연결 기능이 제공되지 않습니다.
렌더링 시간: 복잡한 장면을 처리할 경우 생성 속도가 경쟁사보다 약간 느릴 수 있습니다.

경쟁 구도

Midjourney는 Runway, Luma Labs, Google의 Veo 3, MiniMax의 Hailuo 02 등이 포함된 경쟁 분야에 뛰어듭니다.

장점:

Midjourney의 이미지 생성 워크플로와 완벽하게 통합됩니다.
직관적인 UI와 비용 효율적인 접근성.
실험적인 단편 콘텐츠에 적합합니다.

약점:

오디오가 없습니다.
편집과 장면 길이가 제한적입니다.
해상도는 480p(표준 화질)로 고정되었습니다.

비디오 생성 방법

Midjourney Discord에 참여하세요: Midjourney 봇이 활성화된 채널에 있는지 확인하세요. 활성화되어 있지 않다면 서버에 봇을 추가하거나 공식 Midjourney 서버에 가입하세요.
비디오 명령 호출: 사용 /imagine 설명적 프롬프트와 함께 명령을 추가하세요. --video 매개변수. 예를 들어:

   /imagine “a floating lantern drifting over a serene lake at sunset” --video

기간 사용자 지정(선택 사항): 기본적으로 V1은 10초 클립을 생성하지만 최대 20초까지 길이를 조정할 수 있습니다. --duration. 예 :

   /imagine “city skyline at dawn” --video --duration 20s

세대 대기: 봇이 요청을 처리하여 비디오 파일 또는 링크를 전달합니다. 처리 시간은 서버 부하 및 구독 등급에 따라 달라질 수 있습니다.
다운로드 또는 공유: 생성된 후 제공된 링크를 클릭하면 여러 플랫폼에서 비디오를 보고, 다운로드하고, 공유할 수 있습니다.

규정 준수 및 안전

Midjourney는 엄격한 가이드라인을 시행합니다.

합법적인 사용 권한이 있는 이미지만 업로드할 수 있습니다.
실제 사람이 등장하는 등 불쾌하고 음란하거나 선동적인 콘텐츠를 생성하는 것은 금지되어 있습니다.
시스템은 GPU 시간을 청구하지 않고 자동으로 위반 사항을 필터링합니다.

이번 출시는 Midjourney가 영상 제작 분야로의 본격적인 진출을 알리는 신호탄이자, 인터랙티브 AI 분야에서 더 큰 야망을 펼치기 위한 토대를 마련하는 것입니다. 아직 완전한 영화 제작 도구는 아니지만, 단편 창작을 위한 접근성과 시각적인 매력을 갖춘 도구를 제공합니다.

CometAPI에서 MidJourney 사용하기

CometAPI는 채팅, 이미지, 코드 등을 위한 오픈 소스 및 특수 멀티모달 모델을 포함하여 500개 이상의 AI 모델에 대한 액세스를 제공합니다. CometAPI의 주요 강점은 기존의 복잡한 AI 통합 프로세스를 간소화하는 것입니다.

코멧API 공식 가격보다 훨씬 낮은 가격을 제공하여 통합을 돕습니다. 중간 여정 API 및 Midjourney 비디오 API, 등록 및 로그인 후 계정에서 무료로 체험해 보세요! CometAPI에 가입하고 체험해 보세요. CometAPI는 사용량에 따라 결제됩니다.

v7을 사용하여 이미지를 생성합니다. MidJourney V7을 사용하여 이미지를 생성하기 전에 빌드를 시작해야 합니다. 오늘 CometAPI에 가입하세요 여기에서 무료로 접속하세요. 방문해주세요. 문서. MidJourney V7을 시작하는 것은 매우 간단합니다. --v 7 프롬프트 끝에 매개변수를 추가합니다. 이 간단한 명령은 CometAPI에 최신 V7 모델을 사용하여 이미지를 생성하라고 지시합니다.

비디오 생성: 개발자는 RESTful API를 통해 비디오 생성 기능을 통합할 수 있습니다. 일반적인 요청 구조(예시)

curl --
location 
--request POST 'https://api.cometapi.com/mj/submit/video' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'