캘리포니아주 마운틴뷰에서 열린 Google I/O 2025에서 Google DeepMind와 Google AI 팀은 대규모 언어 모델인 Gemini 2.5 시리즈에 대한 중요한 개선 사항을 공개했습니다. 이러한 업데이트는 제미니 2.5 프로 및 제미니 2.5 플래시 고급 추론 기능, 네이티브 오디오 출력, 다국어 지원, 보안 기능 및 상당한 효율성 향상을 제공하는 다양한 변형이 있습니다. 이러한 개선 사항은 개발자, 기업 및 최종 사용자에게 Google AI Studio, Gemini API 및 Vertex AI 전반에서 더욱 안정적이고 자연스러우며 비용 효율적인 AI 서비스를 제공하는 것을 목표로 합니다.
Gemini 2.5 Pro 개선 사항
Deep Think: 향상된 다중 가설 추론
2.5 Pro의 주요 기능은 다음과 같습니다. 깊은 생각는 모델이 최종 출력을 생성하기 전에 여러 해결 경로를 내부적으로 생성, 비교 및 개선할 수 있도록 하는 실험적 추론 모드입니다. 초기 벤치마크 결과는 Deep Think의 역량을 보여줍니다. 2025년 USAMO 수학 시험에서 84.0위를 차지했고, LiveCodeBench 경쟁 수준 코딩 부문에서 XNUMX위를 차지했으며, MMMU 다중 모드 추론 테스트에서 XNUMX%의 점수를 기록했습니다.
이번 달부터 Deep Think는 Gemini API를 통해 "신뢰할 수 있는 테스터"에게 제공됩니다. 구글은 Deep Think를 더 광범위하게 제공하기 전에 보안 평가에 더 많은 시간이 필요하다고 밝혔습니다.

모국어 오디오 및 다국어 대화
Gemini 2.5 Pro는 텍스트 기능을 기반으로 이제 다음을 지원합니다. 네이티브 오디오 출력 24개 언어에 걸쳐 지원됩니다. 이 기능은 맥락을 인식하는 운율과 감정 표현을 제공하여 AI 상호작용을 더욱 인간적으로 느껴지게 합니다. 오디오와 함께, 이 모델의 대화 시스템은 톤을 동적으로 조정하여 고객 서비스 및 교육 애플리케이션에서 공감을 증폭시킵니다. 초기 데모에는 미묘한 차이를 강조하는 실시간 음성 채팅과 다국어 코드 연습이 포함되어 있어, 진정한 대화형 AI를 향한 Google의 노력을 잘 보여줍니다.
보안 및 신뢰성
2.5 Pro의 보안 강화는 간접 프롬프트 주입 공격 완화에 중점을 두고 있습니다. 업데이트된 프레임워크는 더욱 엄격한 입력 데이터 삭제 및 동적 컨텍스트 필터링을 적용하는데, 이는 민감한 데이터를 처리하는 규제 대상 산업에 필수적입니다. Google 개발자 블로그에 따르면, 이러한 보안 조치는 내부 레드팀 평가에서 취약점을 최대 40%까지 줄여 더 광범위한 기업 도입을 위한 토대를 마련합니다.
Gemini 2.5 플래시 최적화
효율성과 속도
2.5 Pro의 지연 최적화 형제인 Gemini 2.5 Flash가 전면 개편되었습니다. 22% 더 높은 계산 효율성 더욱 빠른 응답 시간을 제공합니다. 기조연설에서 데미스 하사비스는 플래시가 이전 버전에 비해 "거의 모든 측면에서 더 뛰어난 성능"을 제공한다고 언급했으며, Google AI Studio, Vertex AI, Gemini 모바일 앱에서 개발자를 위한 프리뷰 버전을 제공합니다. 정식 출시는 2025년 2.5월 초로 예정되어 있습니다. 현재 출시된 최신 버전의 Gemini XNUMX 플래시는 gemini-2.5-flash-preview-05-20 Google I/O 2025에서.
확장된 멀티모달 기능
Flash와 Pro 버전 모두 새로운 다중 모드 추론 기능을 공유하여 사용자가 텍스트, 이미지, 오디오, 심지어 비디오 입력까지 함께 반복할 수 있도록 합니다. I/O에서 선보인 주요 활용 사례로는 단일 프롬프트에서 생성된 프랙탈 시각화와 교육용 비디오를 인터랙티브 교육 경험으로 변환하는 "Video to Learning App" 파이프라인이 있습니다.
개발자 생태계 업데이트
Google AI Studio 통합
Google AI Studio는 이제 Gemini 2.5 Pro와 Flash 모두에 원활하게 액세스할 수 있도록 지원합니다. 네이티브 코드 편집기는 모델을 직접 임베드하여 개발자가 간단한 프롬프트를 통해 프로덕션 환경에 바로 적용 가능한 웹 앱을 생성할 수 있도록 지원합니다. 시작 템플릿은 대화형 에이전트의 작업을 오디오부터 실시간 데이터 분석 대시보드까지 표시하여 프로토타입 제작 기간을 몇 주에서 몇 분으로 단축합니다.
제미니 API 발전
The 제미니 API 여러 가지 업데이트를 받았습니다:
- 간소화된 함수 호출: 간소화된 스키마 정의로 통합 작업이 30% 줄었습니다.
- 예산 통제에 대한 생각: 이제 개발자는 비용-성능 간 균형에 대한 추론 심도를 높일 수 있습니다.
- 에이전트 워크플로: 새로운 엔드포인트는 다음을 통해 다단계 에이전트 오케스트레이션을 지원합니다. 프로젝트 마리너AI가 단일 호출로 최대 10개의 연결된 작업(예: 데이터 검색, 요약, 보고서 생성)을 자율적으로 수행할 수 있게 해줍니다.
Gemini Code Assist 일반 출시
쌍둥이자리 2.5의 힘 제미니 코드 지원 개인 및 GitHub 통합을 위한 이 도구는 이제 무료 및 유료 티어로 정식 출시되었습니다. 이 도구는 코드 변환, 프런트엔드 UI 생성, 자동 리팩토링에 탁월하여 초보 프로그래머와 숙련된 엔지니어 모두의 요구를 충족합니다.
가용성 및 가격 결정
The 제미니 2.5 시리즈 모든 Google Cloud 고객이 Vertex AI를 통해 액세스할 수 있으며, 성능 등급은 구독 수준에 따라 결정됩니다.
- AI 프로 ($19.99/월)은 Gemini 2.5 Flash와 표준 2.5 Pro 기능에 대한 액세스 권한을 부여합니다.
- AI 울트라 ($249.99/월)을 이용하면 Deep Think, 우선 처리량, 멀티모달 및 에이전트 기능 전체와 함께 30TB 클라우드 스토리지 및 YouTube Premium과 같은 번들 서비스를 이용할 수 있습니다.
결론 및 전망
최신 Gemini 2.5 Pro 및 Flash 업데이트를 통해 Google은 AI 추론, 상호작용성 및 개발자 생산성에 대한 새로운 기준을 제시하고 있습니다. Deep Think의 다중 가설 평가는 네이티브 오디오, 보안 강화 및 효율성 향상과 결합되어 더욱 지능적이고 신뢰할 수 있으며 접근성이 뛰어난 AI 시스템을 위한 길을 열어줍니다. 이러한 모델이 XNUMX월에 출시됨에 따라 Google AI Studio, Gemini API, Vertex AI에 통합됨에 따라 더욱 스마트한 코딩 어시스턴트부터 몰입형 교육 도구에 이르기까지 혁신이 가속화되어 개인과 조직의 인공지능 활용 방식이 변화할 것입니다.
시작 가이드
CometAPI는 Gemini 제품군을 포함한 수백 개의 AI 모델을 일관된 엔드포인트로 통합하는 통합 REST 인터페이스를 제공하며, 내장된 API 키 관리, 사용량 할당량 및 청구 대시보드를 통해 여러 공급업체 URL과 자격 증명을 일일이 관리할 필요가 없습니다.
개발자는 액세스할 수 있습니다 제미니 2.5 플래시 사전 API (모델:gemini-2.5-flash-preview-05-20) and 제미니 2.5 프로 API (모델:gemini-2.5-pro-preview-05-06)등을 통해 코멧API시작하려면 Playground에서 모델의 기능을 탐색하고 다음을 참조하세요. API 가이드 자세한 내용은 CometAPI를 참조하세요. 접속하기 전에 CometAPI에 로그인하고 API 키를 발급받았는지 확인하세요.
