A Midjourney revelou oficialmente sua primeira ferramenta de geração de vídeos com IA, o V1 Video Model, marcando uma expansão significativa de suas capacidades criativas para além das imagens estáticas. O recurso já está disponível para todos os assinantes e permite gerar videoclipes animados de 5 segundos a partir de uma única imagem estática, com instruções de texto opcionais para orientar o movimento e o estilo.
Principais recursos do modelo de vídeo V1
- Animação de imagem para vídeo: Os usuários podem carregar sua própria imagem ou usar uma existente gerada pelo Midjourney para produzir quatro variantes de vídeo de 5 segundos. As animações dão vida a visuais estáticos usando movimentos suaves de câmera e objetos.
- Tempo de reprodução extensível: Os clipes iniciais têm 5 segundos de duração, mas os usuários podem estender cada vídeo em quatro incrementos adicionais de 4 segundos, até um máximo de 20–21 segundos.
- Modos de movimento:
- Movimento baixo: Efeitos sutis para cenas principalmente estáticas.
- Alto movimento: Projetado para cenas com grandes movimentações de câmera ou personagens.
- Solicitações personalizadas: O movimento pode ser guiado por instruções de texto, permitindo que os usuários ditem movimentos de câmera, ações de objetos ou transições.
- Dois estilos de animação:
- Modo Auto: Gera animação automaticamente a partir da imagem.
- Modo Manual: Permite edição rápida antes da renderização da animação.
Uma visão além de clipes curtos
David Holz, CEO da Midjourney, afirmou que este modelo não se resume apenas à criação de B-rolls ou anúncios estilosos. Ele representa um passo crucial em direção ao objetivo de longo prazo da empresa: construir um sistema de simulação de mundo aberto em tempo real, baseado em IA. Essa visão ambiciosa inclui:
- Um espaço 3D totalmente interativo onde os usuários podem se mover livremente.
- Renderização de imagens em tempo real e resposta de cena.
- Personagens e ambientes dinâmicos que respondem às ações do usuário.
Para atingir esse objetivo, a Midjourney está implementando seus componentes fundamentais em fases:
- Geração de imagem (concluída)
- Animação de Vídeo (lançado)
- Interação 3D (em desenvolvimento)
- Otimização de renderização em tempo real (planejada)
Usabilidade e Preço
- Acesso de assinatura: Custando US$ 10/mês, o modelo V1 se posiciona como uma ferramenta criativa altamente acessível para artistas e criadores de conteúdo.
- Custo de renderização: Um lote de 20 clipes estendidos (~80 segundos no total) consome cerca de uma “hora rápida”, custando aproximadamente US$ 4 — uma taxa menor em comparação a concorrentes como o Veo 3 do Google.
- Qualidade de vídeo: Embora não supere significativamente rivais como Dream Machine, da Luma Labs, Midjourney mantém um alto nível de fidelidade visual. Cada quadro se assemelha a uma pintura digital com estética cinematográfica.
Limitações
- Sem suporte de áudio: Ao contrário do Veo 3 ou do Dream Machine, o modelo da Midjourney atualmente não gera trilhas sonoras ou áudio ambiente.
- Restrições de edição: Não há edição de linha de tempo, transições de cena ou vinculação de segmentos disponíveis.
- Tempo de Renderização: A velocidade de geração pode ficar um pouco atrás dos concorrentes ao lidar com cenas complexas.
Cenário Competitivo
A Midjourney entra em um campo lotado que inclui Runway, Luma Labs, Veo 3 do Google e Hailuo 02 da MiniMax.
Pontos fortes:
- Integração perfeita com o fluxo de trabalho de geração de imagens do Midjourney.
- Interface de usuário intuitiva e acesso econômico.
- Ideal para conteúdo experimental de formato curto.
Fraquezas:
- Sem áudio.
- Edição e duração de cena limitadas.
- Resolução fixa em 480p (definição padrão).
Como gerar vídeos
- Junte-se ao Discord do meio da jornada: Certifique-se de estar em um canal onde o bot do Midjourney esteja ativo. Caso contrário, adicione o bot ao seu servidor ou entre no servidor oficial do Midjourney.
- Invocar o comando de vídeo: Use o
/imaginecomando com seu prompt descritivo, anexando o--videoparâmetro. Por exemplo:
/imagine “a floating lantern drifting over a serene lake at sunset” --video
- Personalizar duração (opcional): Por padrão, o V1 produz um clipe de 10 segundos, mas você pode ajustar a duração para até 20 segundos com
--duration. Por exemplo:
/imagine “city skyline at dawn” --video --duration 20s
- Geração Aguarde: O bot processa sua solicitação e envia um arquivo de vídeo ou link. O tempo de processamento pode variar de acordo com a carga do servidor e o seu plano de assinatura.
- Baixe ou Compartilhe: Depois de gerado, clique no link fornecido para visualizar, baixar ou compartilhar seu vídeo em todas as plataformas.
Conformidade e Segurança
A Midjourney impõe diretrizes rígidas:
- Somente imagens com direitos legais de uso podem ser carregadas.
- É proibido gerar conteúdo ofensivo, pornográfico ou incitador, especialmente envolvendo pessoas reais.
- O sistema filtra violações automaticamente sem cobrar tempo de GPU.
Este lançamento marca a investida séria da Midjourney na geração de vídeos e estabelece as bases para suas ambições mais amplas em mundos interativos de IA. Embora ainda não seja um conjunto completo de produção cinematográfica, apresenta uma ferramenta acessível e visualmente atraente para a criatividade em curtas-metragens.
Usar MidJourney no CometAPI
A CometAPI fornece acesso a mais de 500 modelos de IA, incluindo modelos multimodais especializados e de código aberto para bate-papo, imagens, código e muito mais. Seu principal ponto forte é simplificar o processo tradicionalmente complexo de integração de IA.
CometAPI oferecemos um preço muito mais baixo do que o preço oficial para ajudá-lo a integrar API no meio da jornada e API de vídeo Midjourney, e você pode experimentar gratuitamente na sua conta após se registrar e fazer login! Cadastre-se e experimente o CometAPI. O CometAPI é pago conforme o uso.
Use v7 para criar a imagem: Antes de usar o MidJourney V7 para criar uma imagem, você precisa começar a construir em CometAPI hoje – inscreva-se aqui para acesso gratuito. Por favor visite docsComeçar a usar o MidJourney V7 é muito simples: basta adicionar o --v 7 parâmetro no final do seu prompt. Este comando simples diz ao CometAPI para usar o modelo V7 mais recente para gerar sua imagem.
Geração de vídeo: Desenvolvedores podem integrar a geração de vídeo via API RESTful. Uma estrutura típica de solicitação (ilustrativa)
curl --
location
--request POST 'https://api.cometapi.com/mj/submit/video' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'
