Google I/O 2025 lança a atualização mais recente dos modelos da série Gemini 2.5

CometAPI
annaMay 26, 2025
Google I/O 2025 lança a atualização mais recente dos modelos da série Gemini 2.5

No Google I/O 2025, realizado em Mountain View, Califórnia, as equipes do Google DeepMind e do Google AI revelaram melhorias significativas em sua série Gemini 2.5 de modelos de linguagem ampla. Essas atualizações abrangem tanto o Gêmeos 2.5 Pró e Gêmeos 2.5 Flash variantes, introduzindo recursos avançados de raciocínio, saída de áudio nativa, suporte multilíngue, salvaguardas de segurança e ganhos substanciais de eficiência. Coletivamente, essas melhorias visam capacitar desenvolvedores, empresas e usuários finais com serviços de IA mais confiáveis, naturais e econômicos no Google AI Studio, na API Gemini e no Vertex AI.

Melhorias no Gemini 2.5 Pro

Deep Think: Raciocínio Multi-Hipótese Aprimorado

Um recurso de destaque do 2.5 Pro é Pensamento Profundo, um modo de raciocínio experimental que permite ao modelo gerar, comparar e refinar internamente múltiplos caminhos de solução antes de produzir seu resultado final. Os primeiros benchmarks demonstram a proeza do Deep Think: ele lidera no exame de matemática USAMO de 2025, lidera o LiveCodeBench para codificação em nível competitivo e obtém 84.0% no teste de raciocínio multimodal MMMU.

A partir deste mês, o Deep Think estará disponível para "testadores confiáveis" por meio da API Gemini. O Google afirmou que precisa de mais tempo para avaliações de segurança antes de tornar o Deep Think mais amplamente disponível.

Google I/O 2025 lança a atualização mais recente dos modelos da série Gemini 2.5

Áudio nativo e diálogo multilíngue

Com base em seus recursos de texto, o Gemini 2.5 Pro agora oferece suporte saída de áudio nativa em 24 idiomas. Este recurso oferece prosódia sensível ao contexto e inflexão emocional, tornando as interações de IA mais humanas. Além do áudio, o sistema de diálogo do modelo adapta o tom dinamicamente, amplificando a empatia em aplicativos educacionais e de atendimento ao cliente. As primeiras demonstrações incluíam bate-papos de voz em tempo real com ênfase diferenciada e explicações passo a passo de código multilíngue, destacando o avanço do Google em direção a uma IA verdadeiramente conversacional.

Segurança e confiabilidade

Os aprimoramentos de segurança na versão 2.5 Pro concentram-se na mitigação de ataques indiretos de injeção de prompt. A estrutura atualizada emprega uma higienização de entrada mais rigorosa e filtragem dinâmica de contexto, essenciais para setores regulamentados que lidam com dados sensíveis. De acordo com o blog de desenvolvedores do Google, essas salvaguardas reduzem a vulnerabilidade em até 40% nas avaliações internas da equipe vermelha, preparando o terreno para uma adoção corporativa mais ampla.

Otimizações de Flash do Gemini 2.5

Eficiência e Velocidade

Gemini 2.5 Flash, o irmão otimizado para latência do 2.5 Pro, foi revisado para 22% maior eficiência computacional e tempos de resposta mais rápidos. Durante a apresentação, Demis Hassabis observou que o Flash agora "tem um desempenho melhor em quase todas as dimensões" em comparação com seu antecessor, com disponibilidade de pré-visualização para desenvolvedores no Google AI Studio, Vertex AI e no aplicativo móvel Gemini. O lançamento para disponibilidade geral está previsto para o início de junho de 2025. A versão mais recente do Flash Gemini 2.5 está atualmente disponível. gemini-2.5-flash-preview-05-20 no Google I / O 2025.

Capacidades multimodais expandidas

Ambas as versões Flash e Pro compartilham novas capacidades de raciocínio multimodal, permitindo aos usuários interagir em entradas de texto, imagens, áudio e até vídeo. Casos de uso notáveis ​​demonstrados no I/O incluíram visualizações fractais geradas a partir de um único prompt e pipelines de "Vídeo para Aplicativo de Aprendizagem" que convertem vídeos instrucionais em experiências educacionais interativas.

Atualizações do ecossistema do desenvolvedor

Integração do Google AI Studio

O Google AI Studio agora oferece acesso direto ao Gemini 2.5 Pro e ao Flash. O editor de código nativo incorpora os modelos diretamente, permitindo que os desenvolvedores gerem aplicativos web prontos para produção por meio de prompts simples. Os modelos iniciais apresentam tarefas que vão desde agentes conversacionais com áudio até painéis de análise de dados em tempo real, reduzindo os ciclos de protótipos de semanas para minutos.

Avanços da API Gemini

O API Gêmeos recebeu várias atualizações:

  • Chamada de função simplificada: Definições de esquema simplificadas reduzem o esforço de integração em 30%.
  • Pensando em Controles Orçamentários: Os desenvolvedores agora podem definir a profundidade do raciocínio para compensações de custo-desempenho.
  • Fluxos de trabalho do Agentic: Novos endpoints oferecem suporte à orquestração de agentes em várias etapas por meio de Projeto Mariner, permitindo que a IA execute autonomamente até 10 tarefas vinculadas (por exemplo, recuperação de dados, sumarização e geração de relatórios) com uma única chamada.

Disponibilidade geral do Gemini Code Assist

Gêmeos 2.5 poderes Assistente de código Gemini para indivíduos e integrações com o GitHub, agora disponível para todos nos níveis gratuito e pago. Esta ferramenta se destaca na transformação de código, geração de interfaces de usuário front-end e refatoração automatizada, atendendo às necessidades de programadores iniciantes e engenheiros experientes.

Disponibilidade e preço

O Série Gemini 2.5 está acessível a todos os clientes do Google Cloud via Vertex AI, com níveis de desempenho determinados pelo nível de assinatura:

  • Profissional de IA (US$ 19.99/mês) concede acesso aos recursos do Gemini 2.5 Flash e do padrão 2.5 Pro.
  • IA Ultra (US$ 249.99/mês) desbloqueia Deep Think, taxa de transferência prioritária e o conjunto completo de recursos multimodais e de agência, além de serviços agrupados como armazenamento em nuvem de 30 TB e YouTube Premium.

Conclusão e Outlook

Com as atualizações mais recentes do Gemini 2.5 Pro e do Flash, o Google está estabelecendo um novo padrão para raciocínio, interatividade e produtividade de desenvolvedores em IA. A avaliação multi-hipótese do Deep Think, combinada com áudio nativo, avanços em segurança e ganhos de eficiência, abre caminho para sistemas de IA mais inteligentes, confiáveis ​​e acessíveis. Com o lançamento desses modelos em junho, sua integração com o Google AI Studio, a API Gemini e o Vertex AI acelerará a inovação — de assistentes de codificação mais inteligentes a ferramentas educacionais imersivas —, remodelando a forma como indivíduos e organizações utilizam a inteligência artificial.

Começando a jornada

A CometAPI fornece uma interface REST unificada que agrega centenas de modelos de IA — incluindo a família Gemini — em um endpoint consistente, com gerenciamento de chaves de API, cotas de uso e painéis de faturamento integrados. Em vez de lidar com várias URLs e credenciais de fornecedores.

Os desenvolvedores podem acessar Pré-API Flash Gemini 2.5  (modelo:gemini-2.5-flash-preview-05-20) e API Gemini 2.5 Pro (modelo:gemini-2.5-pro-preview-05-06)etc através CometAPI. Para começar, explore as capacidades do modelo no Playground e consulte o Guia de API para obter instruções detalhadas. Antes de acessar, certifique-se de ter feito login no CometAPI e obtido a chave da API.

مزید پڑھیں

500+ ماڈلز ایک API میں

20% تک چھوٹ