Google I/O 2025 выпускает последнее обновление моделей серии Gemini 2.5

CometAPI
annaMay 26, 2025
Google I/O 2025 выпускает последнее обновление моделей серии Gemini 2.5

На конференции Google I/O 2025, которая прошла в Маунтин-Вью, Калифорния, команды Google DeepMind и Google AI представили значительные усовершенствования своей серии Gemini 2.5 крупноязыковых моделей. Эти обновления охватывают как Близнецы 2.5 Про и Близнецы 2.5 Флэш варианты, внедряющие расширенные возможности рассуждения, собственный аудиовыход, многоязычную поддержку, меры безопасности и существенный рост эффективности. В совокупности эти улучшения направлены на то, чтобы предоставить разработчикам, предприятиям и конечным пользователям более надежные, естественные и экономически эффективные службы ИИ в Google AI Studio, Gemini API и Vertex AI.

Улучшения Gemini 2.5 Pro

Глубокое мышление: улучшенное многогипотезное рассуждение

Отличительной особенностью версии 2.5 Pro является Глубоко задуматься, экспериментальный режим рассуждений, который позволяет модели внутренне генерировать, сравнивать и совершенствовать несколько путей решения перед тем, как выдать окончательный результат. Ранние тесты демонстрируют мастерство Deep Think: он лидирует на экзамене USAMO по математике 2025 года, лидирует в LiveCodeBench для кодирования на уровне соревнований и набирает 84.0% на тесте MMMU по мультимодальным рассуждениям.

Начиная с этого месяца Deep Think доступен «доверенным тестировщикам» через API Gemini. Google заявила, что ей нужно больше времени для оценки безопасности, прежде чем сделать Deep Think более доступным.

Google I/O 2025 выпускает последнее обновление моделей серии Gemini 2.5

Родной звук и многоязычный диалог

Gemini 2.5 Pro теперь поддерживает текстовые возможности собственный аудиовыход на 24 языках. Эта функция обеспечивает контекстно-зависимую просодию и эмоциональную интонацию, делая взаимодействие с ИИ более человечным. Наряду со звуком, диалоговая система модели динамически адаптирует тон, усиливая эмпатию в приложениях обслуживания клиентов и образования. Ранние демонстрации включали голосовые чаты в реальном времени с акцентом на нюансы и многоязычные пошаговые инструкции по коду, подчеркивая стремление Google к действительно разговорному ИИ.

Безопасность и надежность

Улучшения безопасности в 2.5 Pro направлены на смягчение атак косвенного внедрения подсказок. Обновленная структура использует более строгую очистку ввода и динамическую фильтрацию контекста, что необходимо для регулируемых отраслей, обрабатывающих конфиденциальные данные. Согласно блогу разработчиков Google, эти меры безопасности снижают уязвимость до 40% во внутренних оценках red-team, закладывая основу для более широкого внедрения на предприятии.

Оптимизация Flash-приложений Gemini 2.5

Эффективность и скорость

Gemini 2.5 Flash, оптимизированный по задержке аналог 2.5 Pro, был переработан для На 22% выше вычислительная эффективность и более быстрое время отклика. В своем выступлении Демис Хассабис отметил, что Flash теперь «работает лучше почти во всех измерениях» по сравнению со своим предшественником, с доступностью предварительной версии для разработчиков в Google AI Studio, Vertex AI и мобильном приложении Gemini. Запуск общедоступной версии запланирован на начало июня 2025 года. Последняя версия Gemini 2.5 flash в настоящее время выпущена gemini-2.5-flash-preview-05-20 на Google I/O 2025.

Расширенные мультимодальные возможности

Оба варианта Flash и Pro разделяют новые возможности мультимодального мышления, позволяя пользователям совместно итерировать текст, изображения, аудио и даже видео входы. Известные примеры использования, показанные на I/O, включали фрактальные визуализации, созданные из одной подсказки, и конвейеры «Video to Learning App», которые преобразуют обучающие видео в интерактивные образовательные опыты.

Обновления экосистемы разработчиков

Интеграция со студией Google AI

Google AI Studio теперь предлагает прямой доступ к Gemini 2.5 Pro и Flash. Редактор собственного кода напрямую встраивает модели, позволяя разработчикам создавать готовые к производству веб-приложения с помощью простых подсказок. Стартовые шаблоны демонстрируют задачи от разговорных агентов со звуком до панелей анализа данных в реальном времени, сокращая циклы прототипирования с недель до минут.

Улучшения API Gemini

The Близнецы API получил несколько обновлений:

  • Оптимизированный вызов функций: Упрощенные определения схем сокращают усилия по интеграции на 30%.
  • Думая о контроле бюджета: Теперь разработчики могут более глубоко проанализировать соотношение цены и производительности.
  • Агентские рабочие процессы: Новые конечные точки поддерживают многошаговую оркестровку агентов через Проект Маринер, что позволяет ИИ автономно выполнять до 10 связанных задач (например, извлечение данных, обобщение и создание отчетов) с помощью одного вызова.

Gemini Code Assist — общедоступная версия

Близнецы 2.5 силы Помощь с кодом Близнецов для отдельных лиц и интеграции GitHub, теперь общедоступные для бесплатных и платных уровней. Этот инструмент отлично подходит для преобразования кода, генерации интерфейса пользователя и автоматизированного рефакторинга, удовлетворяя потребности как начинающих программистов, так и опытных инженеров.

Доступность и цены

The Серия «Джемини 2.5» доступен всем клиентам Google Cloud через Vertex AI, при этом уровни производительности определяются уровнем подписки:

  • ИИ Про (19.99 долл. США в месяц) предоставляет доступ к Gemini 2.5 Flash и стандартным функциям 2.5 Pro.
  • ИИ ультра (249.99 долл. США в месяц) открывает доступ к Deep Think, приоритетной пропускной способности и полному набору мультимодальных и агентских возможностей, а также к таким пакетным услугам, как облачное хранилище объемом 30 ТБ и YouTube Premium.

Вывод и перспективы

С последними обновлениями Gemini 2.5 Pro и Flash Google устанавливает новый стандарт для ИИ-рассуждений, интерактивности и производительности разработчиков. Многогипотезная оценка Deep Think в сочетании с собственным аудио, улучшениями безопасности и повышением эффективности прокладывает путь для более интеллектуальных, надежных и доступных ИИ-систем. Поскольку эти модели будут развернуты в июне, их интеграция в Google AI Studio, Gemini API и Vertex AI ускорит инновации — от более умных помощников по кодированию до иммерсивных образовательных инструментов — изменяя то, как люди и организации используют искусственный интеллект.

Первые шаги

CometAPI предоставляет унифицированный интерфейс REST, который объединяет сотни моделей ИИ, включая семейство Gemini, в единой конечной точке со встроенным управлением ключами API, квотами использования и панелями выставления счетов. Вместо жонглирования несколькими URL-адресами поставщиков и учетными данными.

Разработчики могут получить доступ Gemini 2.5 Flash Pre API  (модель:gemini-2.5-flash-preview-05-20) и расширение API-интерфейс Gemini 2.5 Pro (модель:gemini-2.5-pro-preview-05-06)и т.д. через CometAPI. Для начала изучите возможности модели на игровой площадке и обратитесь к API-руководство для получения подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API.

Читать далее

500+ моделей в одном API

Скидка до 20%