ในงาน Google I/O 2025 ซึ่งจัดขึ้นที่ Mountain View รัฐแคลิฟอร์เนีย ทีม Google DeepMind และ Google AI ได้เปิดตัวการปรับปรุงที่สำคัญสำหรับซีรีส์ Gemini 2.5 ของโมเดลภาษาขนาดใหญ่ การอัปเดตเหล่านี้ครอบคลุมทั้ง ราศีเมถุน 2.5 โปร และ เจมินี่ 2.5 แฟลช การปรับปรุงเหล่านี้มีจุดมุ่งหมายเพื่อเสริมศักยภาพให้กับนักพัฒนา องค์กร และผู้ใช้ปลายทางด้วยบริการ AI ที่เชื่อถือได้ เป็นธรรมชาติ และคุ้มต้นทุนมากขึ้นใน Google AI Studio, Gemini API และ Vertex AI
การปรับปรุง Gemini 2.5 Pro
การคิดเชิงลึก: การใช้เหตุผลแบบหลายสมมติฐานที่ปรับปรุงให้ดีขึ้น
ฟีเจอร์เด่นสำหรับ 2.5 Pro คือ คิดลึกๆโหมดการใช้เหตุผลเชิงทดลองที่ช่วยให้โมเดลสามารถสร้าง เปรียบเทียบ และปรับแต่งเส้นทางการแก้ปัญหาหลาย ๆ ทางภายในได้ก่อนที่จะผลิตผลลัพธ์ขั้นสุดท้าย เกณฑ์มาตรฐานในช่วงแรกแสดงให้เห็นถึงความสามารถของ Deep Think โดยเป็นผู้นำในการทดสอบคณิตศาสตร์ USAMO ปี 2025 อยู่อันดับสูงสุดของ LiveCodeBench สำหรับการเขียนโค้ดระดับการแข่งขัน และทำคะแนนได้ 84.0% ในการทดสอบการใช้เหตุผลแบบหลายโหมดของ MMMU
ตั้งแต่เดือนนี้เป็นต้นไป Deep Think จะพร้อมให้ผู้ทดสอบที่เชื่อถือได้ใช้งานผ่าน Gemini API ได้ Google กล่าวว่าจะต้องใช้เวลาในการประเมินความปลอดภัยเพิ่มเติมก่อนที่จะทำให้ Deep Think พร้อมใช้งานอย่างแพร่หลายมากขึ้น

เสียงพื้นเมืองและบทสนทนาหลายภาษา
ด้วยความสามารถด้านข้อความ Gemini 2.5 Pro จึงรองรับแล้ว เอาท์พุตเสียงดั้งเดิม ครอบคลุม 24 ภาษา ฟีเจอร์นี้ให้เสียงและอารมณ์ที่คำนึงถึงบริบท ทำให้การโต้ตอบของ AI ให้ความรู้สึกเป็นมนุษย์มากขึ้น นอกจากเสียงแล้ว ระบบบทสนทนาของโมเดลยังปรับโทนแบบไดนามิก ช่วยเพิ่มความเห็นอกเห็นใจในด้านการบริการลูกค้าและแอปพลิเคชันด้านการศึกษา การสาธิตในช่วงแรกประกอบด้วยการแชทด้วยเสียงแบบเรียลไทม์ที่เน้นย้ำอย่างละเอียดอ่อนและการแนะนำโค้ดหลายภาษา ซึ่งเน้นย้ำถึงความพยายามของ Google ในการสร้าง AI ที่สามารถสนทนาได้อย่างแท้จริง
ความปลอดภัยและความน่าเชื่อถือ
การปรับปรุงด้านความปลอดภัยใน 2.5 Pro มุ่งเน้นไปที่การลดการโจมตีแบบฉีดพร้อมท์ทางอ้อม เฟรมเวิร์กที่อัปเดตใช้การล้างข้อมูลอินพุตที่เข้มงวดยิ่งขึ้นและการกรองบริบทแบบไดนามิก ซึ่งจำเป็นสำหรับอุตสาหกรรมที่อยู่ภายใต้การควบคุมที่จัดการข้อมูลที่ละเอียดอ่อน ตามบล็อกนักพัฒนาของ Google การป้องกันเหล่านี้ช่วยลดความเสี่ยงได้มากถึง 40% ในการประเมินทีมแดงภายใน ซึ่งช่วยวางรากฐานสำหรับการนำไปใช้ในองค์กรที่กว้างขึ้น
การเพิ่มประสิทธิภาพแฟลช Gemini 2.5
ประสิทธิภาพและความเร็ว
Gemini 2.5 Flash ซึ่งเป็นรุ่นน้องของ 2.5 Pro ที่ได้รับการปรับให้เหมาะกับความล่าช้า ได้รับการปรับปรุงใหม่แล้ว ประสิทธิภาพการคำนวณสูงขึ้น 22% และเวลาตอบสนองที่เร็วขึ้น ในระหว่างการกล่าวปาฐกถาสำคัญ Demis Hassabis กล่าวว่าขณะนี้ Flash "ทำงานได้ดีขึ้นในเกือบทุกมิติ" เมื่อเทียบกับรุ่นก่อนหน้า โดยมีให้นักพัฒนาทดลองใช้งานใน Google AI Studio, Vertex AI และแอปมือถือ Gemini การเปิดตัวให้ใช้งานทั่วไปมีกำหนดในช่วงต้นเดือนมิถุนายน 2025 ปัจจุบันมีการเปิดตัว Gemini 2.5 flash เวอร์ชันล่าสุดแล้ว gemini-2.5-flash-preview-05-20 ที่ Google I/O 2025
ขยายขีดความสามารถหลายโหมด
ทั้ง Flash และ Pro ต่างก็มีความสามารถในการให้เหตุผลแบบมัลติโมดัลใหม่ร่วมกัน ช่วยให้ผู้ใช้สามารถทำการทำซ้ำข้อความ รูปภาพ เสียง และแม้แต่อินพุตวิดีโอได้ กรณีการใช้งานที่โดดเด่นที่แสดงในงาน I/O ได้แก่ การสร้างภาพแบบเศษส่วนที่สร้างจากคำสั่งเดียว และไปป์ไลน์ "Video to Learning App" ที่แปลงวิดีโอการเรียนการสอนเป็นประสบการณ์การเรียนรู้แบบโต้ตอบ
การอัปเดตระบบนิเวศของนักพัฒนา
การรวมระบบ Google AI Studio
ปัจจุบัน Google AI Studio เปิดให้เข้าถึง Gemini 2.5 Pro และ Flash ได้อย่างราบรื่น ตัวแก้ไขโค้ดเนทีฟฝังโมเดลโดยตรง ช่วยให้นักพัฒนาสามารถสร้างแอปเว็บที่พร้อมใช้งานจริงได้ผ่านคำแนะนำง่ายๆ เทมเพลต Starter จะแสดงงานตั้งแต่ตัวแทนสนทนาพร้อมเสียงไปจนถึงแดชบอร์ดการวิเคราะห์ข้อมูลแบบเรียลไทม์ ลดรอบการสร้างต้นแบบจากหลายสัปดาห์เหลือเพียงไม่กี่นาที
ความก้าวหน้าของ API ของ Gemini
การขอ API ราศีเมถุน ได้รับการอัพเดตหลายครั้ง:
- การเรียกฟังก์ชันที่ปรับปรุงใหม่:คำจำกัดความของโครงร่างแบบง่ายช่วยลดความพยายามในการบูรณาการลง 30%
- การคิดควบคุมงบประมาณ:ขณะนี้ นักพัฒนาสามารถพิจารณาเหตุผลเชิงลึกเพื่อแลกเปลี่ยนระหว่างต้นทุนและประสิทธิภาพได้แล้ว
- เวิร์กโฟลว์ของตัวแทน:จุดสิ้นสุดใหม่รองรับการประสานงานตัวแทนหลายขั้นตอนผ่าน โครงการ Marinerทำให้ AI สามารถดำเนินการงานที่เชื่อมโยงกันได้สูงสุด 10 งาน (เช่น การค้นหาข้อมูล การสรุปข้อมูล และการสร้างรายงาน) ด้วยการโทรเพียงครั้งเดียว
ความช่วยเหลือด้านรหัส Gemini พร้อมใช้งานทั่วไป
ราศีเมถุน 2.5 พลัง ช่วยเหลือรหัสราศีเมถุน สำหรับบุคคลทั่วไปและการผสานรวม GitHub ซึ่งขณะนี้มีให้ใช้งานทั่วไปทั้งแบบฟรีและแบบเสียเงิน เครื่องมือนี้โดดเด่นในด้านการแปลงโค้ด การสร้าง UI ของฟรอนต์เอนด์ และการรีแฟกเตอร์อัตโนมัติ ตอบสนองความต้องการของทั้งโปรแกรมเมอร์มือใหม่และวิศวกรที่มีประสบการณ์
ความพร้อมและราคา
การขอ ซีรีย์เจมินี่ 2.5 สามารถเข้าถึงได้โดยลูกค้า Google Cloud ทุกคนผ่าน Vertex AI โดยระดับประสิทธิภาพจะถูกกำหนดตามระดับการสมัครใช้งาน:
- เอไอ โปร (19.99 เหรียญสหรัฐฯ ต่อเดือน) ให้สิทธิ์การเข้าถึง Gemini 2.5 Flash และฟีเจอร์มาตรฐาน 2.5 Pro
- เอไอ อัลตร้า (249.99 เหรียญสหรัฐฯ ต่อเดือน) ปลดล็อค Deep Think การรับส่งข้อมูลที่มีลำดับความสำคัญ และชุดเต็มของความสามารถมัลติโหมดและตัวแทน พร้อมด้วยบริการรวมเช่นพื้นที่เก็บข้อมูลบนคลาวด์ 30 TB และ YouTube Premium
บทสรุปและแนวโน้ม
ด้วยการอัปเดต Gemini 2.5 Pro และ Flash ล่าสุด Google กำลังกำหนดมาตรฐานใหม่สำหรับการใช้เหตุผลของ AI การโต้ตอบ และประสิทธิภาพของนักพัฒนา การประเมินสมมติฐานหลายแบบของ Deep Think ร่วมกับเสียงดั้งเดิม ความก้าวหน้าด้านความปลอดภัย และการเพิ่มประสิทธิภาพ ช่วยปูทางไปสู่ระบบ AI ที่ชาญฉลาด น่าเชื่อถือ และเข้าถึงได้มากขึ้น เมื่อโมเดลเหล่านี้เปิดตัวในเดือนมิถุนายน การผสานรวมโมเดลเหล่านี้กับ Google AI Studio, Gemini API และ Vertex AI จะเร่งให้เกิดนวัตกรรมใหม่ ตั้งแต่ผู้ช่วยเขียนโค้ดที่ชาญฉลาดยิ่งขึ้นไปจนถึงเครื่องมือการศึกษาเชิงลึก ซึ่งจะช่วยปรับเปลี่ยนวิธีที่บุคคลและองค์กรใช้ประโยชน์จากปัญญาประดิษฐ์
เริ่มต้นใช้งาน
CometAPI มอบอินเทอร์เฟซ REST แบบรวมที่รวบรวมโมเดล AI หลายร้อยโมเดล รวมถึงตระกูล Gemini ภายใต้จุดสิ้นสุดที่สอดคล้องกัน พร้อมการจัดการคีย์ API ในตัว โควตาการใช้งาน และแดชบอร์ดการเรียกเก็บเงิน แทนที่จะต้องจัดการ URL และข้อมูลรับรองของผู้ขายหลายราย
นักพัฒนาสามารถเข้าถึงได้ API ของ Gemini 2.5 Flash เบื้องต้น (รุ่น:gemini-2.5-flash-preview-05-20) and API เจมินี่ 2.5 โปร (รุ่น:gemini-2.5-pro-preview-05-06)ฯลฯ ผ่านทาง โคเมทเอพีไอในการเริ่มต้น ให้สำรวจความสามารถของโมเดลใน Playground และดู คู่มือ API สำหรับคำแนะนำโดยละเอียด ก่อนเข้าใช้งาน โปรดตรวจสอบให้แน่ใจว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับรหัส API แล้ว
