Midjourney revela o vídeo V1: primeiro modelo de geração de vídeo de IA

A Midjourney revelou oficialmente sua primeira ferramenta de geração de vídeos com IA, o V1 Video Model, marcando uma expansão significativa de suas capacidades criativas para além das imagens estáticas. O recurso já está disponível para todos os assinantes e permite gerar videoclipes animados de 5 segundos a partir de uma única imagem estática, com instruções de texto opcionais para orientar o movimento e o estilo.

Principais recursos do modelo de vídeo V1

Animação de imagem para vídeo: Os usuários podem carregar sua própria imagem ou usar uma existente gerada pelo Midjourney para produzir quatro variantes de vídeo de 5 segundos. As animações dão vida a visuais estáticos usando movimentos suaves de câmera e objetos.
Tempo de reprodução extensível: Os clipes iniciais têm 5 segundos de duração, mas os usuários podem estender cada vídeo em quatro incrementos adicionais de 4 segundos, até um máximo de 20–21 segundos.
Modos de movimento:
Movimento baixo: Efeitos sutis para cenas principalmente estáticas.
Alto movimento: Projetado para cenas com grandes movimentações de câmera ou personagens.
Solicitações personalizadas: O movimento pode ser guiado por instruções de texto, permitindo que os usuários ditem movimentos de câmera, ações de objetos ou transições.
Dois estilos de animação:
Modo Auto: Gera animação automaticamente a partir da imagem.
Modo Manual: Permite edição rápida antes da renderização da animação.

Uma visão além de clipes curtos

David Holz, CEO da Midjourney, afirmou que este modelo não se resume apenas à criação de B-rolls ou anúncios estilosos. Ele representa um passo crucial em direção ao objetivo de longo prazo da empresa: construir um sistema de simulação de mundo aberto em tempo real, baseado em IA. Essa visão ambiciosa inclui:

Um espaço 3D totalmente interativo onde os usuários podem se mover livremente.
Renderização de imagens em tempo real e resposta de cena.
Personagens e ambientes dinâmicos que respondem às ações do usuário.

Para atingir esse objetivo, a Midjourney está implementando seus componentes fundamentais em fases:

Geração de imagem (concluída)
Animação de Vídeo (lançado)
Interação 3D (em desenvolvimento)
Otimização de renderização em tempo real (planejada)

Usabilidade e Preço

Acesso de assinatura: Custando US$ 10/mês, o modelo V1 se posiciona como uma ferramenta criativa altamente acessível para artistas e criadores de conteúdo.
Custo de renderização: Um lote de 20 clipes estendidos (~80 segundos no total) consome cerca de uma “hora rápida”, custando aproximadamente US$ 4 — uma taxa menor em comparação a concorrentes como o Veo 3 do Google.
Qualidade de vídeo: Embora não supere significativamente rivais como Dream Machine, da Luma Labs, Midjourney mantém um alto nível de fidelidade visual. Cada quadro se assemelha a uma pintura digital com estética cinematográfica.

Limitações

Sem suporte de áudio: Ao contrário do Veo 3 ou do Dream Machine, o modelo da Midjourney atualmente não gera trilhas sonoras ou áudio ambiente.
Restrições de edição: Não há edição de linha de tempo, transições de cena ou vinculação de segmentos disponíveis.
Tempo de Renderização: A velocidade de geração pode ficar um pouco atrás dos concorrentes ao lidar com cenas complexas.

Cenário Competitivo

A Midjourney entra em um campo lotado que inclui Runway, Luma Labs, Veo 3 do Google e Hailuo 02 da MiniMax.

Pontos fortes:

Integração perfeita com o fluxo de trabalho de geração de imagens do Midjourney.
Interface de usuário intuitiva e acesso econômico.
Ideal para conteúdo experimental de formato curto.

Fraquezas:

Sem áudio.
Edição e duração de cena limitadas.
Resolução fixa em 480p (definição padrão).

Como gerar vídeos

Junte-se ao Discord do meio da jornada: Certifique-se de estar em um canal onde o bot do Midjourney esteja ativo. Caso contrário, adicione o bot ao seu servidor ou entre no servidor oficial do Midjourney.
Invocar o comando de vídeo: Use o /imagine comando com seu prompt descritivo, anexando o --video parâmetro. Por exemplo:

   /imagine “a floating lantern drifting over a serene lake at sunset” --video

Personalizar duração (opcional): Por padrão, o V1 produz um clipe de 10 segundos, mas você pode ajustar a duração para até 20 segundos com --duration. Por exemplo:

   /imagine “city skyline at dawn” --video --duration 20s

Geração Aguarde: O bot processa sua solicitação e envia um arquivo de vídeo ou link. O tempo de processamento pode variar de acordo com a carga do servidor e o seu plano de assinatura.
Baixe ou Compartilhe: Depois de gerado, clique no link fornecido para visualizar, baixar ou compartilhar seu vídeo em todas as plataformas.

Conformidade e Segurança

A Midjourney impõe diretrizes rígidas:

Somente imagens com direitos legais de uso podem ser carregadas.
É proibido gerar conteúdo ofensivo, pornográfico ou incitador, especialmente envolvendo pessoas reais.
O sistema filtra violações automaticamente sem cobrar tempo de GPU.

Este lançamento marca a investida séria da Midjourney na geração de vídeos e estabelece as bases para suas ambições mais amplas em mundos interativos de IA. Embora ainda não seja um conjunto completo de produção cinematográfica, apresenta uma ferramenta acessível e visualmente atraente para a criatividade em curtas-metragens.

Usar MidJourney no CometAPI

A CometAPI fornece acesso a mais de 500 modelos de IA, incluindo modelos multimodais especializados e de código aberto para bate-papo, imagens, código e muito mais. Seu principal ponto forte é simplificar o processo tradicionalmente complexo de integração de IA.

CometAPI oferecemos um preço muito mais baixo do que o preço oficial para ajudá-lo a integrar API no meio da jornada e API de vídeo Midjourney, e você pode experimentar gratuitamente na sua conta após se registrar e fazer login! Cadastre-se e experimente o CometAPI. O CometAPI é pago conforme o uso.

Use v7 para criar a imagem: Antes de usar o MidJourney V7 para criar uma imagem, você precisa começar a construir em CometAPI hoje – inscreva-se aqui para acesso gratuito. Por favor visite docsComeçar a usar o MidJourney V7 é muito simples: basta adicionar o --v 7 parâmetro no final do seu prompt. Este comando simples diz ao CometAPI para usar o modelo V7 mais recente para gerar sua imagem.

Geração de vídeo: Desenvolvedores podem integrar a geração de vídeo via API RESTful. Uma estrutura típica de solicitação (ilustrativa)

curl --
location 
--request POST 'https://api.cometapi.com/mj/submit/video' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'