Midjourney dévoile sa première vidéo : premier modèle de génération vidéo basé sur l'IA

Midjourney a officiellement dévoilé son premier outil de génération vidéo basé sur l'IA, le modèle vidéo V1, qui marque une extension significative de ses capacités créatives au-delà de l'imagerie statique. Cette fonctionnalité est désormais disponible pour tous les abonnés et permet de générer des clips vidéo animés de 5 secondes à partir d'une seule image fixe, avec des instructions textuelles facultatives pour guider le mouvement et le style.

Principales caractéristiques du modèle vidéo V1

Animation image-vidéoLes utilisateurs peuvent télécharger leur propre image ou utiliser une image existante générée par Midjourney pour créer quatre variantes vidéo de 5 secondes. Les animations donnent vie à des visuels statiques grâce à des mouvements fluides de caméra et d'objets.
Durée de lecture extensible:Les clips initiaux durent 5 secondes, mais les utilisateurs peuvent prolonger chaque vidéo de quatre incréments supplémentaires de 4 secondes, jusqu'à un maximum de 20 à 21 secondes.
Modes de mouvement:
Faible mouvement: Effets subtils pour des scènes principalement statiques.
Mouvement élevé:Conçu pour les scènes avec des panoramiques de caméra ou des mouvements de personnages importants.
Invites personnalisées:Le mouvement peut être guidé par des invites textuelles, permettant aux utilisateurs de dicter les mouvements de la caméra, les actions des objets ou les transitions.
Deux styles d'animation:
Mode Auto: Génère automatiquement une animation à partir de l'image.
Mode manuel: Permet une édition rapide avant le rendu de l'animation.

Une vision au-delà des courts métrages

David Holz, PDG de Midjourney, a déclaré que ce modèle ne se limite pas à la création de séquences vidéo ou de publicités stylisées. Il représente une étape cruciale vers l'objectif à long terme de l'entreprise : créer un système de simulation en monde ouvert en temps réel, piloté par l'IA. Cette vision ambitieuse comprend :

Un espace 3D entièrement interactif où les utilisateurs peuvent se déplacer librement.
Rendu d'image en temps réel et réponse de la scène.
Personnages et environnements dynamiques qui répondent aux actions de l'utilisateur.

Pour y parvenir, Midjourney déploie ses composants fondamentaux par phases :

Génération d'images (terminée)
Animation vidéo (lancée)
Interaction 3D (en développement)
Optimisation du rendu en temps réel (prévue)

Facilité d'utilisation et prix

Accès par abonnement:Proposé au prix de 10 $/mois, le modèle V1 se positionne comme un outil créatif très accessible pour les artistes et les créateurs de contenu.
Coût de rendu:Un lot de 20 clips étendus (environ 80 secondes au total) consomme environ une « heure rapide », coûtant environ 4 $, un tarif inférieur à celui de concurrents comme Veo 3 de Google.
Qualité vidéoSans dépasser significativement ses concurrents comme Dream Machine de Luma Labs, Midjourney conserve un haut niveau de fidélité visuelle. Chaque image ressemble à une peinture numérique à l'esthétique cinématographique.

Limites

Pas de support audio:Contrairement à Veo 3 ou Dream Machine, le modèle de Midjourney ne génère actuellement pas de bandes sonores ni d'audio ambiant.
Modification des contraintes:Aucune édition de chronologie, transitions de scènes ou liaison de segments n'est disponible.
Temps de rendu:La vitesse de génération peut être légèrement inférieure à celle des concurrents lorsqu'il s'agit de scènes complexes.

Paysage concurrentiel

Midjourney entre dans un domaine encombré qui comprend Runway, Luma Labs, Veo 3 de Google et Hailuo 02 de MiniMax.

Points forts:

Intégration transparente avec le flux de travail de génération d'images de Midjourney.
Interface utilisateur intuitive et accès économique.
Idéal pour le contenu expérimental de courte durée.

Points faibles :

Pas de son.
Montage et durée de scène limités.
Résolution fixe à 480p (définition standard).

Comment générer des vidéos

Rejoignez le Discord de Midjourney: Assurez-vous d'être sur un canal où le bot Midjourney est actif. Sinon, ajoutez-le à votre serveur ou rejoignez le serveur officiel Midjourney.
Invoquer la commande vidéo: utilisez l’outil /imagine commande avec votre invite descriptive, en ajoutant le --video paramètre. Par exemple:

   /imagine “a floating lantern drifting over a serene lake at sunset” --video

Personnaliser la durée (facultatif):Par défaut, V1 produit un clip de 10 secondes, mais vous pouvez ajuster la longueur jusqu'à 20 secondes avec --duration. Par exemple:

   /imagine “city skyline at dawn” --video --duration 20s

Attendre la générationLe bot traite votre demande et vous envoie un fichier vidéo ou un lien. Les délais de traitement peuvent varier en fonction de la charge du serveur et de votre niveau d'abonnement.
Télécharger ou partager:Une fois généré, cliquez sur le lien fourni pour afficher, télécharger ou partager votre vidéo sur plusieurs plateformes.

Conformité et sécurité

Midjourney applique des directives strictes :

Seules les images disposant de droits d'utilisation légaux peuvent être téléchargées.
Il est interdit de générer du contenu offensant, pornographique ou incitatif, notamment impliquant de vraies personnes.
Le système filtre automatiquement les violations sans facturer le temps GPU.

Ce lancement marque l'entrée de Midjourney dans la génération vidéo et pose les bases de ses ambitions plus larges dans les mondes interactifs basés sur l'IA. Bien qu'il ne s'agisse pas encore d'une suite complète de création cinématographique, elle offre un outil accessible et visuellement convaincant pour la création de courts métrages.

Utiliser MidJourney dans CometAPI

CometAPI donne accès à plus de 500 modèles d'IA, dont des modèles multimodaux open source et spécialisés pour le chat, les images, le code, etc. Son principal atout réside dans la simplification du processus traditionnellement complexe d'intégration de l'IA.

API Comet proposer un prix bien inférieur au prix officiel pour vous aider à intégrer API à mi-parcours et API vidéo Midjourney, et vous pouvez l'essayer gratuitement sur votre compte après inscription et connexion ! Bienvenue pour vous inscrire et découvrir CometAPI. CometAPI est payant.

Utilisez v7 pour créer une image : Avant d'utiliser MidJourney V7 pour créer une image, vous devez commencer à construire sur CometAPI aujourd'hui – inscrivez-vous ici pour un accès gratuit. Veuillez visiter docsDémarrer avec MidJourney V7 est très simple : il suffit d'ajouter le --v 7 à la fin de votre invite. Cette commande simple indique à CometAPI d'utiliser le dernier modèle V7 pour générer votre image.

Génération de vidéos : Les développeurs peuvent intégrer la génération vidéo via une API RESTful. Structure de requête typique (à titre d'illustration)

curl --
location 
--request POST 'https://api.cometapi.com/mj/submit/video' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'