Midjourneyは、初のAI動画生成ツール「V1 Video Model」を正式に発表しました。これにより、静止画の枠を超えたクリエイティブ機能が大幅に拡張されます。この機能は現在、すべてのサブスクリプションユーザーにご利用いただけます。5枚の静止画からXNUMX秒間のアニメーション動画クリップを生成でき、オプションでテキストプロンプトを使って動きやスタイルをガイドすることも可能です。
V1ビデオモデルの主な特徴
- 画像からビデオへのアニメーションユーザーは、独自の画像をアップロードするか、Midjourneyが生成した既存の画像を使用して、5秒間の動画をXNUMX種類作成できます。アニメーションは、滑らかなカメラとオブジェクトの動きによって、静止画に活気を与えます。
- 再生時間の延長最初のクリップの長さは 5 秒ですが、ユーザーは各ビデオを 4 秒ずつ延長して、最大 20 ~ 21 秒まで延長できます。
- モーションモード:
- 低モーション: ほとんどが静的なシーンに微妙な効果を加えます。
- ハイモーション: カメラのパンやキャラクターの動きが大きいシーン向けに設計されています。
- カスタム プロンプト: テキスト プロンプトによってモーションをガイドできるため、ユーザーはカメラの動き、オブジェクトの動作、またはトランジションを指示できます。
- 2つのアニメーションスタイル:
- AUTOモード: 画像からアニメーションを自動生成します。
- マニュアルモード: アニメーションのレンダリング前にプロンプト編集を可能にします。
ショートクリップを超えたビジョン
MidjourneyのCEO、David Holz氏は、このモデルは単にスタイリッシュなBロールや広告を制作するだけではないと述べています。これは、同社の長期目標である、リアルタイムAI駆動型オープンワールドシミュレーションシステムの構築に向けた重要な一歩です。この野心的なビジョンには、以下の内容が含まれています。
- ユーザーが自由に移動できる完全にインタラクティブな 3D 空間。
- リアルタイムの画像レンダリングとシーン応答。
- ユーザーのアクションに反応するダイナミックなキャラクターと環境。
これを実現するために、Midjourney は基礎コンポーネントを段階的に展開しています。
- 画像生成(完了)
- ビデオアニメーション(開始)
- 3Dインタラクション(開発中)
- リアルタイムレンダリングの最適化(計画中)
使いやすさと価格
- サブスクリプションアクセス月額 10 ドルの V1 モデルは、アーティストやコンテンツ クリエイターにとって非常に利用しやすいクリエイティブ ツールとして位置付けられています。
- レンダリングコスト: 20 個の拡張クリップ (合計約 80 秒) のバッチには約 4「高速時間」がかかり、コストは約 3 ドルです。これは、Google の Veo XNUMX などの競合製品に比べて低い料金です。
- ビデオ画質Luma LabsのDream Machineのようなライバルを大きく上回るほどではないものの、Midjourneyは高いレベルの視覚的忠実度を維持しています。各フレームは、映画のような美学を持つデジタル絵画のようです。
製品制限
- 音声サポートなし: Veo 3 や Dream Machine とは異なり、Midjourney のモデルは現在、サウンドトラックやアンビエント オーディオを生成しません。
- 編集制約: タイムライン編集、シーントランジション、セグメントリンクは使用できません。
- レンダリング時間: 複雑なシーンを扱う場合、生成速度は競合他社よりわずかに遅れる場合があります。
市場勢力図
Midjourney は、Runway、Luma Labs、Google の Veo 3、MiniMax の Hailuo 02 などを含む競合の分野に参入します。
強み:
- Midjourney の画像生成ワークフローとのシームレスな統合。
- 直感的な UI とコスト効率の高いアクセス。
- 実験的な短編コンテンツに最適です。
弱み:
- 音声はありません。
- 編集とシーンの長さが制限されています。
- 解像度を480p(標準解像度)に固定しました。
動画の作成方法
- ミッドジャーニーディスコードに参加するMidjourney Botがアクティブなチャンネルに参加していることを確認してください。そうでない場合は、ボットをサーバーに追加するか、公式Midjourneyサーバーに参加してください。
- ビデオコマンドを呼び出す: 使用
/imagineコマンドに説明プロンプトを追加し、--videoパラメータ。 例えば:
/imagine “a floating lantern drifting over a serene lake at sunset” --video
- 期間をカスタマイズする(オプション): デフォルトでは、V1は10秒のクリップを生成しますが、
--duration. 例えば:
/imagine “city skyline at dawn” --video --duration 20s
- 世代を待つ: ボットはリクエストを処理し、動画ファイルまたはリンクを配信します。処理時間はサーバーの負荷とサブスクリプションプランによって異なります。
- ダウンロードまたは共有: 生成されたら、提供されたリンクをクリックして、ビデオをプラットフォーム間で表示、ダウンロード、または共有します。
コンプライアンスと安全性
Midjourney では厳格なガイドラインが適用されます。
- 合法的な使用権を持つ画像のみアップロードできます。
- 不快、ポルノ、または扇動的なコンテンツ(特に実在の人物が関与するもの)の作成は禁止されています。
- システムは GPU 時間を課金することなく違反を自動的にフィルタリングします。
今回のリリースは、Midjourneyが動画生成分野に本格的に進出することを象徴するものであり、インタラクティブAIの世界における同社のより広範な野望の基盤を築くものです。まだ完全な映画制作スイートではありませんが、短編映画制作のための、使いやすく視覚的に魅力的なツールを提供します。
CometAPI で MidJourney を使用する
CometAPIは、チャット、画像、コードなどに対応したオープンソースおよび特化型のマルチモーダルモデルを含む、500以上のAIモデルへのアクセスを提供します。その最大の強みは、従来複雑だったAI統合プロセスを簡素化できることです。
コメットAPI 統合を支援するために、公式価格よりもはるかに安い価格を提供します ミッドジャーニーAPI および 旅の途中のビデオ API登録してログインすると、アカウントで無料でお試しいただけます。ぜひ登録して CometAPI を体験してください。CometAPI は従量制です。
v7 を使用してイメージを作成します。 MidJourney V7を使用してイメージを作成する前に、構築を開始する必要があります。 今すぐ CometAPI にサインアップ 無料でアクセスするには、こちらをクリックしてください。 ドキュメントMidJourney V7の使い始めはとても簡単です。 --v 7 パラメータをプロンプトの最後に追加します。この単純なコマンドは、CometAPI に最新の V7 モデルを使用して画像を生成するように指示します。
ビデオ生成: 開発者はRESTful APIを介してビデオ生成を統合できます。典型的なリクエスト構造(例)
curl --
location
--request POST 'https://api.cometapi.com/mj/submit/video' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'
