Tại Google I/O 2025, được tổ chức tại Mountain View, California, nhóm Google DeepMind và Google AI đã công bố những cải tiến đáng kể cho loạt mô hình ngôn ngữ lớn Gemini 2.5 của họ. Những bản cập nhật này bao gồm cả Song Tử 2.5 Pro và Song Tử 2.5 Flash các biến thể, giới thiệu khả năng suy luận nâng cao, đầu ra âm thanh gốc, hỗ trợ đa ngôn ngữ, bảo vệ an ninh và tăng hiệu quả đáng kể. Nhìn chung, những cải tiến này nhằm mục đích trao quyền cho các nhà phát triển, doanh nghiệp và người dùng cuối với các dịch vụ AI đáng tin cậy, tự nhiên và tiết kiệm chi phí hơn trên Google AI Studio, Gemini API và Vertex AI.
Cải tiến của Gemini 2.5 Pro
Deep Think: Lý luận đa giả thuyết nâng cao
Một tính năng nổi bật của 2.5 Pro là Suy nghĩ sâu sắc, một chế độ lý luận thử nghiệm cho phép mô hình tạo, so sánh và tinh chỉnh nhiều đường dẫn giải pháp nội bộ trước khi tạo ra kết quả cuối cùng. Các điểm chuẩn ban đầu chứng minh sức mạnh của Deep Think: dẫn đầu trong kỳ thi toán USAMO năm 2025, đứng đầu LiveCodeBench về mã hóa cấp độ cạnh tranh và đạt 84.0% trong bài kiểm tra lý luận đa phương thức MMMU.
Bắt đầu từ tháng này, Deep Think sẽ có sẵn cho "những người kiểm tra đáng tin cậy" thông qua API Gemini. Google cho biết họ cần thêm thời gian để đánh giá bảo mật trước khi cung cấp Deep Think rộng rãi hơn.

Âm thanh bản địa và Đối thoại đa ngôn ngữ
Dựa trên khả năng văn bản của nó, Gemini 2.5 Pro hiện hỗ trợ đầu ra âm thanh gốc trên 24 ngôn ngữ. Tính năng này cung cấp ngữ điệu nhận biết ngữ cảnh và ngữ điệu cảm xúc, giúp tương tác AI trở nên giống con người hơn. Bên cạnh âm thanh, hệ thống hội thoại của mô hình điều chỉnh tông giọng một cách năng động—khuếch đại sự đồng cảm trong các ứng dụng dịch vụ khách hàng và giáo dục. Các bản demo ban đầu bao gồm trò chuyện bằng giọng nói thời gian thực với sự nhấn mạnh sắc thái và hướng dẫn mã đa ngôn ngữ, làm nổi bật nỗ lực của Google hướng tới AI thực sự có tính hội thoại.
Bảo mật và độ tin cậy
Các cải tiến bảo mật trong 2.5 Pro tập trung vào việc giảm thiểu các cuộc tấn công tiêm nhắc gián tiếp. Khung được cập nhật sử dụng phương pháp vệ sinh đầu vào nghiêm ngặt hơn và lọc ngữ cảnh động, điều cần thiết cho các ngành được quản lý xử lý dữ liệu nhạy cảm. Theo blog dành cho nhà phát triển của Google, các biện pháp bảo vệ này giúp giảm lỗ hổng tới 40% trong các đánh giá nhóm đỏ nội bộ, đặt nền tảng cho việc áp dụng rộng rãi hơn cho doanh nghiệp.
Tối ưu hóa Flash Gemini 2.5
Hiệu quả và tốc độ
Gemini 2.5 Flash, phiên bản được tối ưu hóa độ trễ của 2.5 Pro, đã được cải tiến cho Hiệu suất tính toán cao hơn 22% và thời gian phản hồi nhanh hơn. Trong bài phát biểu quan trọng, Demis Hassabis lưu ý rằng Flash hiện "hoạt động tốt hơn ở hầu hết mọi khía cạnh" so với phiên bản trước, với khả năng xem trước dành cho các nhà phát triển trong Google AI Studio, Vertex AI và ứng dụng di động Gemini. Việc ra mắt khả dụng chung được lên lịch vào đầu tháng 2025 năm 2.5. Phiên bản mới nhất của Flash Gemini XNUMX hiện đang được phát hành là gemini-2.5-flash-preview-05-20 tại Google I/O 2025.
Khả năng đa phương thức mở rộng
Cả hai phiên bản Flash và Pro đều có khả năng lý luận đa phương thức mới, cho phép người dùng lặp lại trên văn bản, hình ảnh, âm thanh và thậm chí cả đầu vào video. Các trường hợp sử dụng đáng chú ý được trình bày tại I/O bao gồm hình ảnh fractal được tạo từ một lời nhắc duy nhất và các đường ống "Video to Learning App" chuyển đổi video hướng dẫn thành trải nghiệm giáo dục tương tác.
Cập nhật hệ sinh thái nhà phát triển
Tích hợp Google AI Studio
Google AI Studio hiện cung cấp quyền truy cập liền mạch vào cả Gemini 2.5 Pro và Flash. Trình chỉnh sửa mã gốc nhúng trực tiếp các mô hình, cho phép các nhà phát triển tạo các ứng dụng web sẵn sàng sản xuất thông qua các lời nhắc đơn giản. Các mẫu khởi động giới thiệu các tác vụ từ các tác nhân đàm thoại có âm thanh đến bảng điều khiển phân tích dữ liệu thời gian thực, rút ngắn chu kỳ tạo mẫu từ nhiều tuần xuống còn vài phút.
Tiến bộ API Gemini
API Song Tử đã nhận được một số bản cập nhật:
- Gọi hàm hợp lý: Định nghĩa lược đồ đơn giản hóa giúp cắt giảm 30% công sức tích hợp.
- Nghĩ về Kiểm soát Ngân sách:Các nhà phát triển hiện có thể điều chỉnh độ sâu lý luận để cân bằng giữa chi phí và hiệu suất.
- Quy trình làm việc của Agentic: Các điểm cuối mới hỗ trợ điều phối tác nhân nhiều bước thông qua Dự án Mariner, cho phép AI tự động thực hiện tối đa 10 tác vụ được liên kết (ví dụ: truy xuất dữ liệu, tóm tắt và tạo báo cáo) chỉ bằng một lệnh gọi.
Gemini Code Assist Khả năng sử dụng chung
Sức mạnh của Song Tử 2.5 Hỗ trợ mã Gemini dành cho cá nhân và tích hợp GitHub, hiện có sẵn cho cả gói miễn phí và trả phí. Công cụ này vượt trội về chuyển đổi mã, tạo giao diện người dùng front-end và tái cấu trúc tự động, đáp ứng nhu cầu của cả lập trình viên mới vào nghề và kỹ sư dày dạn kinh nghiệm.
Tính sẵn có và giá cả
Dòng Gemini 2.5 có thể truy cập được cho tất cả khách hàng của Google Cloud thông qua Vertex AI, với các mức hiệu suất được xác định theo cấp độ đăng ký:
- trí tuệ nhân tạo (19.99 đô la/tháng) cấp quyền truy cập vào Gemini 2.5 Flash và các tính năng chuẩn của 2.5 Pro.
- AI siêu (249.99 đô la/tháng) mở khóa Deep Think, thông lượng ưu tiên và bộ đầy đủ các khả năng đa phương thức và đại lý, cùng với các dịch vụ đi kèm như dung lượng lưu trữ đám mây 30 TB và YouTube Premium.
Kết luận và Outlook
Với bản cập nhật Gemini 2.5 Pro và Flash mới nhất, Google đang thiết lập một chuẩn mực mới cho lý luận AI, tính tương tác và năng suất của nhà phát triển. Đánh giá đa giả thuyết của Deep Think, kết hợp với âm thanh gốc, các tiến bộ về bảo mật và hiệu quả tăng lên, mở đường cho các hệ thống AI thông minh hơn, đáng tin cậy hơn và dễ tiếp cận hơn. Khi các mô hình này được triển khai vào tháng XNUMX, việc tích hợp chúng trên Google AI Studio, Gemini API và Vertex AI sẽ đẩy nhanh quá trình đổi mới—từ trợ lý mã hóa thông minh hơn đến các công cụ giáo dục nhập vai—định hình lại cách các cá nhân và tổ chức khai thác trí tuệ nhân tạo.
Bắt đầu
CometAPI cung cấp giao diện REST thống nhất tổng hợp hàng trăm mô hình AI—bao gồm cả gia đình Gemini—dưới một điểm cuối nhất quán, với quản lý khóa API tích hợp, hạn ngạch sử dụng và bảng điều khiển thanh toán. Thay vì phải xử lý nhiều URL và thông tin xác thực của nhà cung cấp.
Các nhà phát triển có thể truy cập Gemini 2.5 Flash Pre API (người mẫu:gemini-2.5-flash-preview-05-20) Và API Gemini 2.5 Pro (người mẫu:gemini-2.5-pro-preview-05-06)vv thông qua Sao chổiAPI. Để bắt đầu, hãy khám phá các khả năng của mô hình trong Sân chơi và tham khảo Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API.
