Veo 3.1 арқылы бейнелерді қалай өңдеуге болады

CometAPI
annaDec 2, 2025
Veo 3.1 арқылы бейнелерді қалай өңдеуге болады

Google көпшілікке таныстырды Veo 3.1 (және а Veo 3.1 Fast нұсқасы) 2025 жылдың қазан айының ортасында мәтінді бейнеге көшірудің жақсартылған үлгісі ретінде жоғары дәлдіктегі қысқа клиптерді шығарады. жергілікті аудио, жақсырақ жылдам ұстану және жаңа өңдеу мүмкіндіктері сияқты көрініс/клип кеңейтімі, кадрдан кадрға интерполяция, және суретке бағытталған генерациялау (үш анықтамалық кескінге дейін пайдаланыңыз). Veo 3.1 арқылы қол жетімді API, ішінде пайда болады Егіздер қолданба және Flow шығармашылық құрал болып табылады және арқылы кәсіпорын әзірлеушілеріне ұшырайды Vertex AI және Google AI Studio (қол жетімділік платформаға және жоспарға байланысты өзгереді). Flow интеграциясы пайдаланушы интерфейсін өңдеудің көбірек басқару элементтерін (жарықтандыру/көлеңкелер, нысанды енгізу/жою жақын арада) әкеледі, ал API интерфейстері әзірлеушілер үшін бағдарламалық жасақтау және кеңейту мүмкіндіктерін көрсетеді.

Мен Veo 3.1 (Flow, CometAPI/Gemini API — қадамдық) арқылы бейнелерді өңдеу туралы нұсқаулық беремін.

Veo 3.1 не істейді және ол қайдан келді?

Veo 3.1 — мәтіндік шақыруларды және міндетті түрде кескіндерді немесе бұрыннан бар бейне кадрларды — синтезделген аудио (диалог, қоршаған дыбыстар, SFX) бар қысқа, когерентті, фотореалды немесе стильдендірілген бейнеклиптерге айналдыру үшін жасалған Google генеративті бейне үлгілерінің (Veo) соңғы итерациясы. 3.1 жаңартуы баса көрсетеді жақсырақ реализм, бай аудио, және үздіксіздігін қамтамасыз ететін құралдар (көрініс кеңейтімі және кадр интерполяциясы), Veo-ны Google мәтіндік және кескін үлгілеріне бейнеге бағытталған әріптес ретінде орналастыру.

3.1-дегі негізгі жаңартулар мыналарды қамтиды:

  • Жасалған клиптер үшін жергілікті аудио және диалог синтезі (бөлек дауыстық құбыр қажет емес).
  • Кадрдан кадрға интерполяция (құрылған клипті жүргізетін бірінші және соңғы кадр).
  • Кескінге бағытталған генерация (сипат/стиль үйлесімділігін сақтау үшін үш анықтамалық кескінге дейін пайдаланыңыз).
  • Көрініс кеңейтімі (алдыңғы клиптердің соңғы секундынан алынған байланыстырушы клиптерді жасау арқылы үздіксіздікті сақтаңыз).
  • Жақсырақ жылдам ұстану және жақсартылған кинематографиялық басқару.

Veo 3.1 қай жерде жұмыс істейді?

Veo 3.1 Google жүйесінде қол жетімді API (ақылы алдын ала қарау), Vertex AI / Модельдік бақ, Gemini мобильді/веб қолданбалары, және Flow және Veo Studio көрсетілімдерімен біріктірілген. CometAPI Veo-ны да біріктіре бастады.

Flow ішіндегі Veo 3.1 арқылы бейнелерді қалай өңдеуге болады? кезең-кезеңімен

Төменде мен ең көп тараған бағдарламалық және UI жұмыс процестерін аралаймын: Flow бағдарламасында өңдеу (жасаушы UI), Gemini қолданбасын пайдалану (жылдам генерация) және Gemini API / Vertex AI бағдарламалық құралын пайдалану (өндіріс және автоматтандыру үшін).

Flow (жасаушының UI) көмегімен бейнелерді қалай өңдеуге болады?

Flow — ұрпақ үшін Veo үлгілерін біріктіретін режиссерлерге/жасаушыларға арналған Google-дың шығармашылық интерфейсі және өңдеуді басқару құралдарының жиынтығы (жарықтандыру, көлеңкелеу, көрініс композициясы, нысанды енгізу/жою құралдары). Flow ішіндегі Veo 3.1 көмегімен сіз:

  • Аудиосы жоғары кадрларды жасаңыз немесе қайта жасаңыз.
  • «Бейнеге арналған ингредиенттерді» пайдаланыңыз (тұрақты таңбалар/стильдер үшін анықтамалық кескіндерді жүктеп салыңыз).
  • Көріністерді кеңейтіңіз немесе бірнеше кадрларды Scene Extension көмегімен біріктіріңіз (жаңа клиптерді алдыңғы клип аяқталуларына қосады).
  • UI ішінде негізгі нысанды енгізуді және (жақында) жоюды қолданыңыз.

Ағында негізгі өңдеуді қалай орындаймын (практикалық қадамдар)?

  1. Тұқымдық клипті жасаңыз/генерациялаңыз (мәтіндік шақыру немесе кескін шақыру).
  2. Клиптің соңын таңдау үшін уақыт шкаласын пайдаланыңыз және таңдаңыз Кеңейтіңіз (Сахна кеңейтімі) әрекетті жалғастыру немесе қозғалыс қосу үшін жаңа шақырумен. Әрбір кеңейтім үздіксіздікті сақтау үшін жүйе араласатын шағын секіруді қосады.
  3. Нысан өзгертулері үшін Кірістіру құралын пайдаланыңыз (қосылатын элементті және қай жерді сипаттаңыз). Жою үшін қол жетімді болған кезде Flow's Remove (Жою) құралын орындаңыз және құрастыру артефактілерін тексеріңіз.
  4. Экспорттаңыз және қажет болса, түстерді бағалау, субтитрлер немесе дәл кесу үшін дәстүрлі NLE (Premiere, DaVinci Resolve) арқылы жылтыратыңыз.
    Flow қайталанатын шығармашылық өңдеулерді жылдам жасауға арналған; оны уақыт кестесін өңдеу мен генеративті ауыстыру арасындағы гибрид ретінде қарастырыңыз.

Veo 3.1 API арқылы бейнелерді бағдарламалы түрде қалай өңдеуге немесе жасауға болады

Екі негізгі бағдарламалық бағыт бар:

  • Gemini API (генеративті тіл / Gemini SDK) — Veo үлгілерін генерациялау және кеңейту үшін тікелей шақыру үшін пайдаланылады (мысалдар Google Gemini API құжаттарында берілген).
  • CometAPI (OpenAI пішімі/ чат)— CometAPI қол жеткізуді ұсынады Gemini 3 Pro кескіні (Nano Banana Pro),Gemini 3 Pro , және чатқа, суретке, музыкаға және бейне жасауға арналған 100-ден астам AI үлгілеріне қол жеткізе аласыз Veo 3.1 OpenAI стиліндегі сөйлесу нүктесі арқылы.

Veo 3.1 көмегімен өңдеуді бірнеше ерекше ағындар ретінде қарастыруға болады. Әрбір ағын өндіріске дайын нәтижелерді алу үшін үлгі енгізулерін (мәтін / суреттер / бейне) және өңдеуден кейінгі қадамды біріктіреді.

Veo 3.1 API интерфейстері арқылы көрсетіледі. Типтік үлгі - ұзаққа созылатын үлгі generateVideos операция — сіз тапсырманы жариялайсыз, операцияны сұрайсыз және аяқталғаннан кейін шығыс файлын жүктейсіз.

Төменде жеңілдетілген, іске қосуға болатын мысалдар берілген — API кілттерімен және ортасымен бейімделу. ; ортаңыздың SDK және аутентификация нұсқауларын қараңыз.

JavaScript (түйін) мысалы — жасау және сұрау

Мысал Gemini API мәнерін пайдалануға негізделген.

import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});

const prompt = "A cinematic shot of a majestic lion in the savannah. Add ambient wind and distant bird calls.";
let operation = await ai.models.generateVideos({
  model: "veo-3.1-generate-preview",
  prompt,
});

// Poll
while (!operation.done) {
  console.log("Waiting...");
  await new Promise(r => setTimeout(r, 10000));
  operation = await ai.operations.getVideosOperation({ operation: operation });
}
// Download and save the generated video from operation.response.generated_videos

Бұл үлгі (жіберу → сауалнама → жүктеп алу) Gemini құжаттарындағы канондық әдіс болып табылады.

Python SDK орнына curl/REST пайдалана аламын ба?

Иә — ресми веб-сайттар SDK көрсетеді, бірақ негізгі veo 3.1 нұсқасын REST арқылы пайдалануға болады. Іске асыру орталар бойынша әр түрлі болады (Gemini API және CometAPI REST). Егер сіз curl таңдасаңыз, дұрыс аутентификацияны (Google Cloud немесе cometAPIAPI кілтінен тасымалдаушы таңбалауыштары) орындағаныңызға көз жеткізіңіз және өніміңізге тән бейне жасау үшін соңғы нүктені пайдаланыңыз. CometAPI жалған бұралу мысалы (аутентификация және соңғы нүктеге бейімделу):

curl "https://api.cometapi.com/v1/chat/completions" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "veo-3.1",
    "prompt": "A simple prompt describing the action",
    "config": {"aspect_ratio":"16:9","length_seconds":8}
  }' --output generated_response.json

маңызды: нақты REST URL мекенжайы және пайдалы жүктеме құрылымы пайдалану-пайдалануыңызға байланысты Gemini API or CometAPI соңғы нүктелер — сұрауларды жібермес бұрын өнім құжаттарымен кеңесіңіз. SDKs сіз үшін көптеген аутентификация және сауалнама мәліметтерін өңдейді.

Veo 3.1 қалай пайдалануға болады — қандай жұмыс процестеріне қолдау көрсетіледі?

Төменде мен Veo 3.1 нұсқасымен өңдеу кезінде пайдаланатын практикалық ағындар арқылы өтетін боламын: UX ағындары (Flow/Gemini studio) және бағдарламалық ағындар (Gemini API / Vertex API). Әрбір ағын үшін мысалдарды, ескертулерді және көшіруге болатын шағын код үзінділерін көрсетемін.

Veo 3.1 көмегімен өңдеуді бірнеше ерекше ағындар ретінде қарастыруға болады. Әрбір ағын өндіріске дайын нәтижелерді алу үшін үлгі енгізулерін (мәтін / суреттер / бейне) және өңдеуден кейінгі қадамды біріктіреді.

Негізгі өңдеу жұмыс үрдістері

Сіз жиі қолданатын үш практикалық өңдеу ағыны бар:

  1. Мәтінге негізделген өңдеулер және қайта құрулар — шақыруды қайта жазу немесе сол көрініске жаңа нұсқауларды қолдану арқылы кадрды өзгерту.
  2. Анықтамалық кескінді басқаратын өңдеу («Бейнеге арналған ингредиенттер») — жасалған кадрларда таңбаны немесе нысанды сақтау үшін 3 суретке дейін жеткізесіз.
  3. Кадр интерполяциясы (алғашқы және соңғы кадр) — басталу және аяқталу кескінін беріңіз және Veo олардың арасындағы ауысу ретін жасайды (сұралған жағдайда дыбыспен).
  4. Сахна кеңейтімі — алдыңғы клиптің соңғы секундынан жалғасатын байланыстырушы клипті жасау арқылы бар Veo-генерацияланған (немесе басқа) клипті кеңейтіңіз.
  5. Нысанды енгізу/жою және басқа Ағынды өңдеу құралдары — Veo мүмкіндіктерінің үстіне кейбір Flow UI мүмкіндіктері (нысанды енгізу/жою, дудльді шақыру, камера бұрышын қайта түсіру) қосылады және GUI-де кадр деңгейінде ретуш жасауға көмектеседі.

Ескертпелер мен кеңестер: сәйкес аутентификацияны пайдаланыңыз (Gemini API кілті / CometAPI API кілті). Мысал veo-3.1-generate-preview пайдаланады — үлгі идентификаторлары мен параметр атаулары SDK нұсқалары мен аймақтарында сәл өзгеше болуы мүмкін; CometAPI veo 3.1 үлгі идентификаторы veo3.1-pro және veo3.1 болып табылады.

1) Мәтін → Бейне (жаңа буын)

Қолдану: Сценарийден немесе шығармашылық ұсыныстан жаңа қысқа клип жасаңыз.

Flow:

  1. Көрініс сипаттамасын, камера бағытын және аудио сигналдарын (диалог немесе дыбыс әсерлері) қамтитын анық мәтіндік нұсқауды дайындаңыз.
  2. Егіздерге қоңырау шалыңыз бейнелерді жасау Veo 3.1 үлгісін қолданатын соңғы нүкте.
  3. Ұзақ уақытқа созылған операцияны генерациялау аяқталғанша сұраңыз, нәтижесінде MP4 файлын жүктеп алыңыз, содан кейін қарап шығыңыз және қайталаңыз.

Қарапайым Python мысалы (мәтін → бейне):

Ресми Google пайдаланыңыз Генай Python үшін клиент. Бұл үзінді Veo 3.1 көмегімен шақырудан қысқа бейне жасауды көрсетеді.

# Requires google-genai Python client configured with credentials

import time
from google import genai

client = genai.Client()

prompt = """A cinematic close-up of a detective in a rainy alley, neon reflections on puddles.
He whispers, 'This is the clue we've been missing.' Add distant thunder and footsteps."""
operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt=prompt,
)

# Poll until done

while not operation.done:
    print("Waiting for generation...")
    time.sleep(8)
    operation = client.operations.get(operation)

# Save video

generated = operation.response.generated_videos
client.files.download(file=generated.video)
generated.video.save("text_to_video.mp4")
print("Saved text_to_video.mp4")

2) Кескін → Бейне (бастапқы кескінді жандандыру)

Қолдану: Өнімнің түсірілімін, кейіпкер портретін немесе жалғыз фотосуретті қысқа клипке айналдырыңыз.

Flow:

  1. Бастапқы кескінді жасаңыз немесе таңдаңыз (Nano Banana сияқты кескін үлгісі арқылы жасауға болады).
  2. Суретті ретінде жүктеңіз image параметр және шақыру generate_videos, таңдау бойынша жеткізу referenceImages немесе lastFrame интерполяцияға арналған.
  3. Қайта алу және қарау; шақыруларды немесе кескін активтерін қайталаңыз.

Python кескіні→бейне үзіндісі (сурет бөлек жасалады):

Veo 3.1 ең практикалық мүмкіндіктерінің бірі болып табылады анықтамалық суреттер: 3 кескінге дейін (адам, өнім, нысан) қамтамасыз етіңіз, осылайша жасалған бейне кадрлар арасында сол көріністі сақтайды.

# Python: use reference images with Veo 3.1

from google import genai
from google.genai import types
client = genai.Client()

prompt = "A product demo shot: the smartwatch rotates, displaying the UI and a glowing notification tone."

# reference_image_* can be binary content or file references depending on the SDK

operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt=prompt,
    config=types.GenerateVideosConfig(
        reference_images=,  # up to 3

        aspect_ratio="16:9",
        length_seconds=8
    ),
)

# handle operation result and download as earlier example

Тәжірибелік кеңестер:

  • Нысанды пайдалы бұрыштардан түсіретін анық, жақсы жарықтандырылған анықтамалық кескіндерге артықшылық беріңіз.
  • Өнімнің сәйкестігін, киімін немесе кейіпкердің бетін бірнеше рет түсіру кезінде сақтау үшін сілтемелерді пайдаланыңыз.
  • Рұқсатсыз авторлық құқықпен қорғалған немесе жеке тұлғалардың суреттерінен аулақ болыңыз.

3) Бейнеден бейнеге / кеңейтім (жалғастыру немесе қайта түсіру)

Қолдану: Бар жасалған клипті кеңейтіңіз немесе оның соңынан тыс әрекетті жалғастырыңыз немесе бұрын жасалған бейнені қайта өңдеу үшін негіз ретінде пайдаланыңыз.

Flow:

  1. Жасалған бейнені ретінде қамтамасыз етіңіз video бейненің қалай жалғасуы керектігін сипаттайтын нұсқауды енгізіңіз және жасаңыз (мысалы, «Ұзарту: кейіпкер есікті ашып, жарыққа кіреді»).
  2. Ұзарту режимін пайдалану — Veo 3.1 соңғы секундты аяқтайды және қозғалысты жалғастырады. Ескертпе: соңғы секундта дыбыс болмаса, дауыс кеңейтімі сенімді емес.

Python мысалы (бар бейнені кеңейту):

operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    video=previous_generated_video,  # a Video object from previous generation

    prompt="Extend: The paraglider slowly descends and lands by a meadow.",
    config=types.GenerateVideosConfig(number_of_videos=1, resolution="720p")
)
# Poll and download...

Жұмыс процесі туралы жазба: ұзағырақ тізбектерді құру үшін клиптерді қайта-қайта ұзарту (әрбір жаңа жасалған клипті алдыңғысының соңына дейін тігу). Артефакттардың жинақталуын есте сақтаңыз — сенімділікті сақтау үшін жоғары сапалы анықтамалық кадрларға мезгіл-мезгіл қайта бекітіңіз немесе бөлімдерді қайта жасаңыз.


4) Кадрға арнайы өңдеу (алғашқы және соңғы кадрлар, анықтамалық кескіндер)

Бастапқы кадрдан соңғы кадрға ауысатын бейнені жасауға болады. алдымен кескінді жасау (мысалы, Gemini кескін үлгісімен), содан кейін сол кескінді кескін ретінде жіберіңіз және интерполяцияны жүргізу үшін конфигурацияда last_frame параметрін орнатыңыз.

Қолдану: Тығыз визуалды үздіксіздікті немесе екі көрсетілген кадр арасында анимация жасауды қалайсыз.

Flow:

  1. Бірінші және соңғы кадрды жасаңыз немесе жүктеңіз.
  2. Veo 3.1-ге қоңырау шалыңыз image=first_frame және config.last_frame=last_frame.
  3. Модель сол кадрлар арасында интерполяция жасайды, бұл сіздің сұрауыңызға сәйкес келетін қозғалыс пен дыбыс шығарады.

Неліктен бұл маңызды? Шығармашылық басқару үшін бірінші/соңғы кадр камера кадрын және композициясын дәл бастау/аяқтау үшін анықтауға мүмкіндік береді, бұл VFX, үздіксіздік немесе баяндау ырғағы үшін маңызды.

Python (сурет → бейне)

# Step 1: make an image (using a Gemini image model)

image_resp = client.models.generate_content(
    model="gemini-2.5-flash-image",
    contents="A stylized watercolor painting of a fox in a moonlit forest",
    config={"response_modalities": }
)
first_image = image_resp.parts.as_image()
# Step 2: use the image as the first_frame and specify a last_frame image (optional)

operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt="Transition to a fox bounding across snow toward the camera.",
    image=first_image,
    config={"last_frame": some_last_image, "number_of_videos": 1}
)
# Poll and download as before...

Бұл екі анықталған визуалды якорь арасындағы тегіс интерполяцияны береді.

Veo 3.1 нұсқасымен қандай жедел және енгізу стратегиялары жақсы жұмыс істейді?

Veo 3.1 визуалды композицияны, қозғалысты, дыбысты және эмоционалды реңкті анық сипаттайтын құрылымдық сұрауларға жақсы жауап береді. Veo 3.1 нұсқасына арналған Google "нұсқаулығы" арнайы ингредиенттерді ұсынады; міне, қысқартылған бақылау тізімі:

Жедел анатомия (ұсынылады)

  • Бастапқы көрініс — ықшам сөйлем: кім/не, бастауыш қимыл.
  • Камера сипаттамасы — жақыннан / кең / қуыршақ / тұрақты / қолмен, камера қозғалысы және кадр.
  • Уақыт және қарқын — дәлдік қажет болса, «баяу», «кинематографиялық 24 кадр/с сезім» сияқты қысқа белгілер немесе кадр саны.
  • Аудио сигналдар — фондық ортаны, арнайы дыбыс әсерлерін немесе диалогтарды (тырнақшаға) көрсетіңіз. Veo 3.1 түпнұсқа дыбысты синтездей алады.
  • Стиль және сілтемелер — қамтиды referenceImages немесе фотографиялық/фильм мәнерлерін атап өтіңіз: «фильм ноир, жоғары контраст, Kodak 500 сезімі».
  • Теріс шақырулар — нені көрсетсеңіз жоқ (мысалы, «логотиптер, мәтін жоқ, мультфильм стилі жоқ») қалаусыз нәтижелерді азайтуды қалайды.

Анықтамалық суреттерді пайдалану

Кескінді нұсқау және бірінші/соңғы кадр интерполяциясы Veo 3.1 мүмкіндіктері болып табылады. Жалпы, жоғары сапалы құбыр:

  • Тұрақты нысандардың (адамдар, өнімдер) сыртқы түрін/стильді анықтайтын кескін үлгісі (Nano Banana немесе Gemini кескін үлгілері) арқылы 1–3 анықтамалық кескіні бар қозғалыссыз активтерді жасаңыз немесе нақтылаңыз. Veo анықтамалық активтерді басшылыққа алған кезде нысанның сыртқы түрін жақсы сақтайды.
  • Бұл активтерді анықтамалық кескіндерге (немесе бірінші/соңғы кадрларға) құрастырыңыз.
  • Бейнені жасау / интерполяция / кеңейту үшін Veo 3.1 қоңырау шалыңыз.
  • Қосымша өңдеуден кейінгі Стандартты бейне құралдарымен (Premiere, DaVinci Resolve) (түстерді бағалау, қысу, қолмен өңдеу).

Токендер, ұзындық және рұқсаттамалар

  • Veo 3.1 мәтіндік кірістерінде таңбалауыш шектеулері бар (мысалы, белгілі бір алдын ала қарау нұсқалары үшін ~1 024 таңбалауыш) және шығыс әдетте бір қысқа бейне (мысалдар жиі 8 секундты көрсетеді); қысқаша және қайталанатын болыңыз. Ұзақ мазмұн үшін бірнеше жасалған клиптерді тігуді жоспарлаңыз.

Қорытынды — Veo 3.1 жасаушылар мен редакторлар үшін нені өзгертеді

Veo 3.1 қысқа пішінді, аудио-анықтама AI бейне генерациясында практикалық секіруді білдіреді. Бұл жай ғана генератор емес: ол генераторға айналуда өңдеу көмекшісі Flow және Gemini Studio сияқты ішкі құралдар, олар бірдей генеративті примитивтерді қайта пайдалана отырып, жасаушыларға хирургиялық өңдеулер (нысанды енгізу/жою, камераны қайта түсіру) жасауға мүмкіндік береді. Әзірлеушілер мен пост топтары үшін ұсынылатын тәсіл итеративті болып табылады: қысқа түсірілімдерді жасау және кеңейту үшін API пайдаланыңыз, үздіксіздік үшін анықтамалық кадрларды пайдаланыңыз және дәстүрлі құралдармен соңғы құрастыру мен аудио араластыруды орындаңыз.

Әзірлеушілер қол жеткізе алады Veo 3.1 API және Gemini 3 Pro кескіні (Nano Banana Pro) CometAPI арқылы. Бастау үшін CometAPI үлгісінің мүмкіндіктерін зерттеңіз Ойын алаңы және кеңесу  API нұсқаулығы егжей-тегжейлі нұсқаулар үшін. Қол жеткізу алдында CometAPI жүйесіне кіріп, API кілтін алғаныңызға көз жеткізіңіз. СetAPI біріктіруге көмектесу үшін ресми бағадан әлдеқайда төмен баға ұсыныңыз.

Баруға дайынсыз ба?→ CometAPI-ге бүгін тіркеліңіз !

Егер сіз AI туралы көбірек кеңестер, нұсқаулықтар және жаңалықтар білгіңіз келсе, бізге жазылыңыз VKX және Арасындағы айырмашылық!

Толығырақ оқу

500+ модель бір API-да

20%-ға дейін жеңілдік