Google I/O 2025 lanza la última actualización de los modelos de la serie Gemini 2.5

En Google I/O 2025, celebrado en Mountain View, California, los equipos de Google DeepMind y Google AI presentaron mejoras significativas en su serie Gemini 2.5 de modelos de lenguaje grande. Estas actualizaciones abarcan tanto... Géminis 2.5 Pro y Géminis 2.5 Flash Variantes que incorporan capacidades de razonamiento avanzadas, salida de audio nativa, compatibilidad multilingüe, medidas de seguridad y mejoras sustanciales en la eficiencia. En conjunto, estas mejoras buscan brindar a desarrolladores, empresas y usuarios finales servicios de IA más confiables, naturales y rentables en Google AI Studio, la API de Gemini y Vertex AI.

Mejoras de Gemini 2.5 Pro

Pensamiento profundo: razonamiento mejorado de múltiples hipótesis

Una característica destacada de 2.5 Pro es Pensamiento profundoUn modo de razonamiento experimental que permite al modelo generar, comparar y refinar internamente múltiples vías de solución antes de producir su resultado final. Los primeros puntos de referencia demuestran la destreza de Deep Think: lidera el examen de matemáticas USAMO 2025, lidera el LiveCodeBench en programación de nivel competitivo y obtiene una puntuación del 84.0 % en la prueba de razonamiento multimodal de la MMMU.

A partir de este mes, Deep Think estará disponible para los evaluadores de confianza a través de la API de Gemini. Google indicó que necesita más tiempo para realizar evaluaciones de seguridad antes de que Deep Think esté disponible de forma más generalizada.

Google I/O 2025 lanza la última actualización de los modelos de la serie Gemini 2.5

Audio nativo y diálogo multilingüe

Basándose en sus capacidades de texto, Gemini 2.5 Pro ahora admite salida de audio nativa Disponible en 24 idiomas. Esta función proporciona prosodia contextual e inflexión emocional, lo que humaniza las interacciones con IA. Además del audio, el sistema de diálogo del modelo adapta el tono dinámicamente, lo que potencia la empatía en aplicaciones educativas y de atención al cliente. Las primeras demostraciones incluyeron chats de voz en tiempo real con énfasis matizado y guías de código multilingües, lo que pone de manifiesto el impulso de Google hacia una IA verdaderamente conversacional.

Seguridad y confiabilidad

Las mejoras de seguridad en la versión 2.5 Pro se centran en mitigar los ataques indirectos de inyección rápida. El marco actualizado emplea una limpieza de entrada más estricta y un filtrado de contexto dinámico, esenciales para las industrias reguladas que gestionan datos confidenciales. Según el blog para desarrolladores de Google, estas medidas de seguridad reducen la vulnerabilidad hasta en un 40 % en las evaluaciones internas del equipo rojo, lo que sienta las bases para una adopción más amplia en las empresas.

Optimizaciones de Flash de Gemini 2.5

Eficiencia y rapidez

Gemini 2.5 Flash, el hermano de 2.5 Pro con latencia optimizada, ha sido renovado para 22% más de eficiencia computacional y tiempos de respuesta más rápidos. Durante la presentación, Demis Hassabis señaló que Flash ahora "tiene un mejor rendimiento en casi todas las dimensiones" en comparación con su predecesor, con disponibilidad de vista previa para desarrolladores en Google AI Studio, Vertex AI y la aplicación móvil Gemini. El lanzamiento general está previsto para principios de junio de 2025. La última versión de Flash Gemini 2.5 está disponible actualmente. gemini-2.5-flash-preview-05-20 en Google I / O 2025.

Capacidades multimodales ampliadas

Tanto las versiones Flash como Pro comparten nuevas capacidades de razonamiento multimodal, lo que permite a los usuarios iterar conjuntamente con entradas de texto, imágenes, audio e incluso vídeo. Entre los casos de uso destacados que se mostraron en I/O se incluyen visualizaciones fractales generadas a partir de una única indicación y canales de conversión de vídeo en aplicación de aprendizaje que convierten vídeos instructivos en experiencias educativas interactivas.

Actualizaciones del ecosistema de desarrolladores

Integración con Google AI Studio

Google AI Studio ahora ofrece acceso sin problemas a Gemini 2.5 Pro y Flash. El editor de código nativo integra los modelos directamente, lo que permite a los desarrolladores generar aplicaciones web listas para producción mediante instrucciones sencillas. Las plantillas de inicio muestran tareas desde agentes conversacionales con audio hasta paneles de análisis de datos en tiempo real, lo que reduce los ciclos de creación de prototipos de semanas a minutos.

Avances en la API de Gemini

El elemento API de Géminis recibió varias actualizaciones:

Llamada de funciones optimizada:Las definiciones de esquema simplificadas reducen el esfuerzo de integración en un 30%.
Pensando en los controles presupuestarios:Los desarrolladores ahora pueden ajustar la profundidad del razonamiento para lograr compensaciones entre costo y rendimiento.
Flujos de trabajo de Agentic:Los nuevos puntos finales admiten la orquestación de agentes en varios pasos a través de Proyecto Mariner, lo que permite que la IA realice de forma autónoma hasta 10 tareas vinculadas (por ejemplo, recuperación de datos, resumen y generación de informes) con una sola llamada.

Asistencia de código Gemini: disponibilidad general

Potencias de Géminis 2.5 Asistencia de código Géminis Para usuarios individuales e integraciones de GitHub, ahora disponible para todos los niveles, tanto gratuitos como de pago. Esta herramienta destaca en la transformación de código, la generación de interfaces de usuario (UI) front-end y la refactorización automatizada, satisfaciendo las necesidades tanto de programadores principiantes como de ingenieros experimentados.

Disponibilidad y precio

El elemento Serie Géminis 2.5 es accesible para todos los clientes de Google Cloud a través de Vertex AI, con niveles de rendimiento determinados por el nivel de suscripción:

IA profesional ($19.99/mes) otorga acceso a Gemini 2.5 Flash y a las funciones estándar de 2.5 Pro.
IA Ultra ($249.99/mes) desbloquea Deep Think, rendimiento prioritario y el conjunto completo de capacidades multimodales y de agencia, junto con servicios incluidos como almacenamiento en la nube de 30 TB y YouTube Premium.

Conclusión y perspectivas

Con las últimas actualizaciones de Gemini 2.5 Pro y Flash, Google establece un nuevo estándar para el razonamiento, la interactividad y la productividad de los desarrolladores de IA. La evaluación multihipótesis de Deep Think, combinada con audio nativo, mejoras de seguridad y mejoras de eficiencia, allana el camino para sistemas de IA más inteligentes, fiables y accesibles. Con el lanzamiento de estos modelos en junio, su integración en Google AI Studio, la API de Gemini y Vertex AI acelerará la innovación —desde asistentes de programación más inteligentes hasta herramientas educativas inmersivas—, transformando la forma en que las personas y las organizaciones aprovechan la inteligencia artificial.

Primeros Pasos

CometAPI proporciona una interfaz REST unificada que integra cientos de modelos de IA, incluida la familia Gemini, en un punto final consistente, con gestión de claves API integrada, cuotas de uso y paneles de facturación. En lugar de tener que gestionar múltiples URL y credenciales de proveedores.

Los desarrolladores pueden acceder API pre-Flash de Gemini 2.5 (modelo:gemini-2.5-flash-preview-05-20) y API de Gemini 2.5 Pro (modelo:gemini-2.5-pro-preview-05-06)etc. a través de CometAPIPara comenzar, explore las capacidades del modelo en el Playground y consulte la Guía de API Para obtener instrucciones detalladas, consulte la sección "Antes de acceder, asegúrese de haber iniciado sesión en CometAPI y de haber obtenido la clave API".