Home/Models/Anthropic/Claude 3.5 Sonnet
C

Claude 3.5 Sonnet

อินพุต:$2.4/M
เอาต์พุต:$12/M
บริบท:200K
เอาต์พุตสูงสุด:64K
Claude 3.5 Sonnet is a production-grade large language model (LLM) from Anthropic introduced as the first member of the Claude 3.5 family. It was positioned to raise the bar for practical intelligence — improving instruction following, multi-step reasoning and developer/agent workflows — while keeping response latency and cost comparable to Anthropic’s previous “Sonnet” tier.
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API
เวอร์ชัน

คุณสมบัติพื้นฐาน (สิ่งที่ Claude Sonnet 3.5 มอบให้คุณ)

  • การให้เหตุผลที่แข็งแกร่งและการปฏิบัติตามคำสั่ง: ปรับจูนสำหรับงานตรรกะหลายขั้นตอนและการถาม-ตอบเอกสาร
  • เอเจนต์และการใช้เครื่องมือ: สร้างมาเพื่อรองรับการเรียกใช้เครื่องมือที่ทนทานและการจัดวางลำดับงานแบบเอเจนต์ (เช่น การเลือกเครื่องมือ การแก้ไขข้อผิดพลาด) Anthropic ได้เพิ่มความสามารถแบบ public-beta ชื่อ computer-use ที่ทำให้ Claude โต้ตอบกับ GUI (เคอร์เซอร์ การคลิก การพิมพ์) ในมุมมอง “flipbook” ความสามารถนี้ยังเป็นเชิงทดลองแต่โดดเด่นสำหรับการทำงานอัตโนมัติกับงาน GUI
  • ความสามารถในการเขียนโค้ดที่แข็งแกร่ง: ทำผลงานได้แข่งขันใน HumanEval / SWE-bench (ดู Benchmarks)
  • การจัดการด้านความปลอดภัยและความเป็นส่วนตัว: Anthropic เน้นการฝึกแบบให้ความสำคัญกับความปลอดภัยและดีฟอลต์ที่ปลอดภัยยิ่งขึ้นในตระกูล Claude

รายละเอียดทาง技术ของ Claude 3.5 Sonnet

  • มัลติโหมด: รองรับข้อความ + รูปภาพ (Vision API รองรับรูปแบบ base64 หรือ URL) รวมถึงแผนภูมิ/กราฟและการถามตอบเชิงภาพ
  • บริบทยาว: หน้าต่างบริบทที่เผยแพร่ประมาณ ~200k โทเค็น สำหรับเอกสารยาวและการวิเคราะห์หลายไฟล์
  • การให้เหตุผลและการเขียนโค้ดที่แข็งแกร่งกว่ารุ่นกลางก่อนหน้า: ปรับปรุงเป้าหมายบนเบนช์มาร์กสำหรับนักพัฒนา (ดู Benchmarks)
  • รองรับเครื่องมือ/เอเจนต์: Messages API รองรับแพตเทิร์นการใช้เครื่องมือ (รันโค้ด ดึงเว็บ เอเจนต์สไตล์ “computer use”) และเอาต์พุต JSON เชิงโครงสร้างเพื่อการอินทิเกรตที่ทนทาน
  • แนวทางการฝึกที่ให้ความสำคัญกับความปลอดภัย: สอดคล้องหลักการ Constitutional AI และเทคนิคตัวกรอง/ป้องกันเพิ่มเติม

ผลงานบนเบนช์มาร์กของ Claude 3.5 Sonnet

เบนช์มาร์กขึ้นกับสไตล์พรอมป์ต จำนวนตัวอย่าง และสแนปช็อตรุ่นที่ใช้ ด้านล่างเป็นตัวเลขสาธารณะที่มักอ้างอิง (มีลิงก์ไปยังผู้ขายหรือหน้าเบนช์มาร์กสาธารณะ):

  • BIG-Bench-Hard (3-shot CoT / รายงานโดย Sonnet): ~93.1% — สะท้อนความสามารถในการให้เหตุผลหลายขั้นตอนที่แข็งแกร่งบนชุด BIG-Bench-Hard ตามที่ผู้ขาย/พาร์ตเนอร์รายงาน
  • HumanEval (ความถูกต้องของโค้ด): ~93–94% (คะแนน HumanEval ระดับแนวหน้าตามข้อมูลของ Anthropic/GitHub Copilot) จัดอยู่ในกลุ่มผลงานสูงบนการทดสอบสังเคราะห์โปรแกรมมาตรฐาน
  • SWE-bench (การโค้ดเชิงเอเจนต์/แก้ปัญหา GitHub แบบ “Verified”): ~49% (Sonnet ปรับปรุงจากรุ่นก่อนบนงาน SWE-bench Verified) หมายเหตุ: SWE-bench เน้นการแก้ปัญหาบน GitHub จริง จึงไวต่อสไตล์พรอมป์ตและสภาพแวดล้อม/เครื่องมือ

ข้อควรระวังเกี่ยวกับเบนช์มาร์ก: ผู้ขายและผู้ประเมินภายนอกใช้เทมเพลตพรอมป์ต การตั้งค่าตัวอย่าง และเกณฑ์ต่างกัน ใช้ตัวเลขเหล่านี้เพื่อการเทียบเชิงสัญญาณมากกว่าการรับประกันผลในงานผลิตจริง

ข้อจำกัดและความเสี่ยงที่ทราบของ Claude 3.5 Sonnet

  • ภาพหลอน/ข้อเท็จจริงผิดพลาด: ลดบางโหมดล้มเหลวเมื่อเทียบรุ่นเก่า แต่ยังอาจให้ข้อมูลผิด โดยเฉพาะข้อมูลเฉพาะทางหรือข่าวล่าสุด ควรใช้การเรียกคืน/RAG และการยืนยันสำหรับงานความเสี่ยงสูง
  • ฟีเจอร์เชิงทดลอง: ความสามารถ computer-use เป็น public beta และยังผิดพลาดได้ (มองหน้าจอแบบ flipbook; เหตุการณ์ UI ระยะสั้นอาจพลาด) ไม่ควรพึ่งโดยไม่มีการมอนิเตอร์ที่เข้มงวดในงานวิกฤตหรือจับเวลาแน่น
  • อคติและการ์ดเรลความปลอดภัย: รับการปรับจูนสไตล์ปลอดภัยของ Anthropic ซึ่งลดผลลัพธ์ไม่ปลอดภัยหลายแบบ แต่บางครั้งอาจปฏิเสธหรือกรองในกรณีคลุมเครือ
  • ข้อจำกัดเชิงปฏิบัติการ: โควตาโทเค็น อัตราเรียก ราคา และพื้นที่ให้บริการต่างกันตามแพลตฟอร์ม (Anthropic direct, Bedrock, Vertex AI) ควรปักเวอร์ชันและตรวจโควตาก่อนใช้งานจริง

การเปรียบเทียบกับ gpt 4o และ Claude 4

(การเปรียบเทียบเป็นเชิงประมาณและขึ้นกับสแนปช็อต ตัวเลขด้านล่างสรุปจากคำกล่าวอ้างสาธารณะ)

  • เทียบกับ GPT-4 / GPT-4o (OpenAI): Sonnet มักรายงานคะแนนสูงกว่าในเบนช์มาร์กการให้เหตุผลหลายขั้นและความถูกต้องของโค้ด (เช่น HumanEval / BIG-Bench ตามข้อมูลผู้ขาย) ขณะที่รุ่น GPT ยังแข่งขันได้ในงานคณิต/CoT และเครื่องมือ (พร้อมสมดุล latency/ค่าใช้จ่ายที่ต่างกัน) ผลจริงขึ้นกับเบนช์มาร์ก
  • เทียบกับ Opus / Claude 4 ของ Anthropic เอง: Opus / Claude 4 (และ Sonnet รุ่นหลัง) อาจเหนือกว่าในงานซับซ้อนที่สุดที่ใช้คอมพิวต์มาก; Sonnet ยังคงน่าสนใจสำหรับเวิร์กโฟลว์เชิงเอเจนต์ที่ต้องสมดุลต้นทุน/ความหน่วง

ข้อแนะนำ: ทำ A/B test สั้นๆ เฉพาะโดเมน (พรอมป์ตเดียวกัน ปักเวอร์ชันรุ่น) แทนการพึ่งบอร์ดจัดอันดับสาธารณะเพียงอย่างเดียว; ประโยชน์จริงขึ้นกับงาน


กรณีใช้งานในการผลิตที่พบบ่อย

  • ระบบอัตโนมัติเชิงเอเจนต์: จัดการเครื่องมือ, ตรีอาจทิกเก็ต, คำสั่งเครื่องมือแบบมีโครงสร้าง และงาน GUI อัตโนมัติ (พร้อมมอนิเตอร์)
  • วิศวกรรมซอฟต์แวร์และผู้ช่วยโค้ด: สร้าง/แปลง/ย้ายโค้ด สรุป PR ข้อเสนอการดีบัก — ความแข็งแกร่งบน SWE-bench / HumanEval ทำให้เหมาะกับผู้ช่วยโค้ด
  • ถาม-ตอบเอกสารและสรุปความ: เข้าใจบริบทลึกสำหรับสัญญา งานวิจัย เอกสารยาว (จับคู่กับ retrieval)
  • ดึงข้อมูลจากภาพ: ใช้กับการดึง/เข้าใจข้อมูลจากกราฟ/ตารางเมื่อแพลตฟอร์มรองรับภาพอินพุต

วิธีเข้าถึง Claude Sonnet 3.5 API

ขั้นตอนที่ 1: ลงชื่อสมัครเพื่อรับ API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ CometAPI console รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่รายการ API token ในศูนย์ส่วนบุคคล รับโทเค็นคีย์: sk-xxxxx แล้วส่ง

ภาพ

ขั้นตอนที่ 2: ส่งคำขอไปยัง Claude Opus 4.1

เลือกปลายทาง “claude-3-5-sonnet-20241022” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการและโครงสร้าง request body ดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมี Apifox ให้ทดสอบเพื่อความสะดวก แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ base url อยู่ในรูปแบบ Anthropic Messages และ Chat

ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับ API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและยืนยันผลลัพธ์

ประมวลผลการตอบกลับ API เพื่อดึงผลลัพธ์ หลังการประมวลผล API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต

คุณสมบัติสำหรับ Claude 3.5 Sonnet

มัลติโมดัล: รองรับทั้งข้อความและรูปภาพ (Vision API ที่รับรูปภาพแบบ base64 หรือ URL) รวมถึงแผนภูมิ/กราฟและการตอบคำถามเชิงภาพ บริบทยาว: หน้าต่างบริบทที่ประกาศไว้ราว ~200k โทเค็น สำหรับเอกสารยาวและการวิเคราะห์หลายไฟล์ Anthropic ความสามารถด้านการให้เหตุผลและการเขียนโค้ดที่แข็งแกร่งกว่ารุ่นระดับกลางก่อนหน้า: มุ่งยกระดับคะแนนบนเบนช์มาร์กสำหรับนักพัฒนา (ดู Benchmarks) Anthropic +1 การรองรับเครื่องมือ/เอเยนต์: Messages API รองรับรูปแบบการใช้เครื่องมือ (การรันโค้ด การดึงข้อมูลจากเว็บ เอเยนต์สไตล์ “computer use”) และเอาต์พุต JSON แบบมีโครงสร้างเพื่อการผสานรวมที่เชื่อถือได้ แนวทางการฝึกที่ให้ความสำคัญกับความปลอดภัยเป็นอันดับแรก: สร้างขึ้นตามหลักการ Constitutional AI ของ Anthropic และเทคนิคตัวจัดประเภท/มาตรการป้องกันเพิ่มเติม

ราคาสำหรับ Claude 3.5 Sonnet

สำรวจราคาที่แข่งขันได้สำหรับ Claude 3.5 Sonnet ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Claude 3.5 Sonnet สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)ราคาทางการ (USD / M Tokens)ส่วนลด
อินพุต:$2.4/M
เอาต์พุต:$12/M
ต่อวินาที:$20
-88%

โค้ดตัวอย่างและ API สำหรับ Claude 3.5 Sonnet

Claude 3.5 Sonnet API มอบการเข้าถึงเชิงโปรแกรมแก่นักพัฒนาไปยังโมเดลภาษาปัญญาประดิษฐ์ขั้นสูงของ Anthropic โดยมอบสมดุลระหว่างความชาญฉลาดและประสิทธิภาพ เพื่อการผสานรวมเข้ากับแอปพลิเคชันและบริการหลากหลาย.

รุ่นของ Claude 3.5 Sonnet

เหตุผลที่ Claude 3.5 Sonnet มีสแนปช็อตหลายตัวอาจรวมถึงปัจจัยที่อาจเกิดขึ้น เช่น ความแปรผันของผลลัพธ์หลังการอัปเดตที่ต้องการสแนปช็อตรุ่นเก่าสำหรับความสม่ำเสมอ การให้ช่วงเวลาเปลี่ยนผ่านสำหรับนักพัฒนาเพื่อการปรับตัวและการย้ายข้อมูล และสแนปช็อตที่แตกต่างกันซึ่งสอดคล้องกับเอนด์พอยต์ระดับโลกหรือระดับภูมิภาคเพื่อเพิ่มประสิทธิภาพประสบการณ์ผู้ใช้ สำหรับความแตกต่างโดยละเอียดระหว่างเวอร์ชัน โปรดอ้างอิงเอกสารทางการ
cometapi-3-5-sonnet
claude-3-5-sonnet-20240620เปิดตัวครั้งแรกของ Claude 3.5 Sonnet (การเปิดตัวครั้งแรกของตระกูล Claude 3.5)
claude-3-5-sonnet-20241022Anthropic ประกาศ Claude 3.5 Sonnet รุ่นอัปเกรด (ปรับปรุงด้านการเขียนโค้ด/การมองเห็น และอัปเดตรายละเอียดด้านราคา).
claude-3-5-sonnet-latest
cometapi-3-5-sonnet

โมเดลเพิ่มเติม