คุณสมบัติพื้นฐาน (สิ่งที่ Claude Sonnet 3.5 มอบให้คุณ)

การให้เหตุผลที่แข็งแกร่งและการปฏิบัติตามคำสั่ง: ปรับจูนสำหรับงานตรรกะหลายขั้นตอนและการถาม-ตอบเอกสาร
เอเจนต์และการใช้เครื่องมือ: สร้างมาเพื่อรองรับการเรียกใช้เครื่องมือที่ทนทานและการจัดวางลำดับงานแบบเอเจนต์ (เช่น การเลือกเครื่องมือ การแก้ไขข้อผิดพลาด) Anthropic ได้เพิ่มความสามารถแบบ public-beta ชื่อ computer-use ที่ทำให้ Claude โต้ตอบกับ GUI (เคอร์เซอร์ การคลิก การพิมพ์) ในมุมมอง “flipbook” ความสามารถนี้ยังเป็นเชิงทดลองแต่โดดเด่นสำหรับการทำงานอัตโนมัติกับงาน GUI
ความสามารถในการเขียนโค้ดที่แข็งแกร่ง: ทำผลงานได้แข่งขันใน HumanEval / SWE-bench (ดู Benchmarks)
การจัดการด้านความปลอดภัยและความเป็นส่วนตัว: Anthropic เน้นการฝึกแบบให้ความสำคัญกับความปลอดภัยและดีฟอลต์ที่ปลอดภัยยิ่งขึ้นในตระกูล Claude

รายละเอียดทาง技术ของ Claude 3.5 Sonnet

มัลติโหมด: รองรับข้อความ + รูปภาพ (Vision API รองรับรูปแบบ base64 หรือ URL) รวมถึงแผนภูมิ/กราฟและการถามตอบเชิงภาพ
บริบทยาว: หน้าต่างบริบทที่เผยแพร่ประมาณ ~200k โทเค็น สำหรับเอกสารยาวและการวิเคราะห์หลายไฟล์
การให้เหตุผลและการเขียนโค้ดที่แข็งแกร่งกว่ารุ่นกลางก่อนหน้า: ปรับปรุงเป้าหมายบนเบนช์มาร์กสำหรับนักพัฒนา (ดู Benchmarks)
รองรับเครื่องมือ/เอเจนต์: Messages API รองรับแพตเทิร์นการใช้เครื่องมือ (รันโค้ด ดึงเว็บ เอเจนต์สไตล์ “computer use”) และเอาต์พุต JSON เชิงโครงสร้างเพื่อการอินทิเกรตที่ทนทาน
แนวทางการฝึกที่ให้ความสำคัญกับความปลอดภัย: สอดคล้องหลักการ Constitutional AI และเทคนิคตัวกรอง/ป้องกันเพิ่มเติม

ผลงานบนเบนช์มาร์กของ Claude 3.5 Sonnet

เบนช์มาร์กขึ้นกับสไตล์พรอมป์ต จำนวนตัวอย่าง และสแนปช็อตรุ่นที่ใช้ ด้านล่างเป็นตัวเลขสาธารณะที่มักอ้างอิง (มีลิงก์ไปยังผู้ขายหรือหน้าเบนช์มาร์กสาธารณะ):

BIG-Bench-Hard (3-shot CoT / รายงานโดย Sonnet): ~93.1% — สะท้อนความสามารถในการให้เหตุผลหลายขั้นตอนที่แข็งแกร่งบนชุด BIG-Bench-Hard ตามที่ผู้ขาย/พาร์ตเนอร์รายงาน
HumanEval (ความถูกต้องของโค้ด): ~93–94% (คะแนน HumanEval ระดับแนวหน้าตามข้อมูลของ Anthropic/GitHub Copilot) จัดอยู่ในกลุ่มผลงานสูงบนการทดสอบสังเคราะห์โปรแกรมมาตรฐาน
SWE-bench (การโค้ดเชิงเอเจนต์/แก้ปัญหา GitHub แบบ “Verified”): ~49% (Sonnet ปรับปรุงจากรุ่นก่อนบนงาน SWE-bench Verified) หมายเหตุ: SWE-bench เน้นการแก้ปัญหาบน GitHub จริง จึงไวต่อสไตล์พรอมป์ตและสภาพแวดล้อม/เครื่องมือ

ข้อควรระวังเกี่ยวกับเบนช์มาร์ก: ผู้ขายและผู้ประเมินภายนอกใช้เทมเพลตพรอมป์ต การตั้งค่าตัวอย่าง และเกณฑ์ต่างกัน ใช้ตัวเลขเหล่านี้เพื่อการเทียบเชิงสัญญาณมากกว่าการรับประกันผลในงานผลิตจริง

ข้อจำกัดและความเสี่ยงที่ทราบของ Claude 3.5 Sonnet

ภาพหลอน/ข้อเท็จจริงผิดพลาด: ลดบางโหมดล้มเหลวเมื่อเทียบรุ่นเก่า แต่ยังอาจให้ข้อมูลผิด โดยเฉพาะข้อมูลเฉพาะทางหรือข่าวล่าสุด ควรใช้การเรียกคืน/RAG และการยืนยันสำหรับงานความเสี่ยงสูง
ฟีเจอร์เชิงทดลอง: ความสามารถ computer-use เป็น public beta และยังผิดพลาดได้ (มองหน้าจอแบบ flipbook; เหตุการณ์ UI ระยะสั้นอาจพลาด) ไม่ควรพึ่งโดยไม่มีการมอนิเตอร์ที่เข้มงวดในงานวิกฤตหรือจับเวลาแน่น
อคติและการ์ดเรลความปลอดภัย: รับการปรับจูนสไตล์ปลอดภัยของ Anthropic ซึ่งลดผลลัพธ์ไม่ปลอดภัยหลายแบบ แต่บางครั้งอาจปฏิเสธหรือกรองในกรณีคลุมเครือ
ข้อจำกัดเชิงปฏิบัติการ: โควตาโทเค็น อัตราเรียก ราคา และพื้นที่ให้บริการต่างกันตามแพลตฟอร์ม (Anthropic direct, Bedrock, Vertex AI) ควรปักเวอร์ชันและตรวจโควตาก่อนใช้งานจริง

การเปรียบเทียบกับ gpt 4o และ Claude 4

(การเปรียบเทียบเป็นเชิงประมาณและขึ้นกับสแนปช็อต ตัวเลขด้านล่างสรุปจากคำกล่าวอ้างสาธารณะ)

เทียบกับ GPT-4 / GPT-4o (OpenAI): Sonnet มักรายงานคะแนนสูงกว่าในเบนช์มาร์กการให้เหตุผลหลายขั้นและความถูกต้องของโค้ด (เช่น HumanEval / BIG-Bench ตามข้อมูลผู้ขาย) ขณะที่รุ่น GPT ยังแข่งขันได้ในงานคณิต/CoT และเครื่องมือ (พร้อมสมดุล latency/ค่าใช้จ่ายที่ต่างกัน) ผลจริงขึ้นกับเบนช์มาร์ก
เทียบกับ Opus / Claude 4 ของ Anthropic เอง: Opus / Claude 4 (และ Sonnet รุ่นหลัง) อาจเหนือกว่าในงานซับซ้อนที่สุดที่ใช้คอมพิวต์มาก; Sonnet ยังคงน่าสนใจสำหรับเวิร์กโฟลว์เชิงเอเจนต์ที่ต้องสมดุลต้นทุน/ความหน่วง

ข้อแนะนำ: ทำ A/B test สั้นๆ เฉพาะโดเมน (พรอมป์ตเดียวกัน ปักเวอร์ชันรุ่น) แทนการพึ่งบอร์ดจัดอันดับสาธารณะเพียงอย่างเดียว; ประโยชน์จริงขึ้นกับงาน

กรณีใช้งานในการผลิตที่พบบ่อย

ระบบอัตโนมัติเชิงเอเจนต์: จัดการเครื่องมือ, ตรีอาจทิกเก็ต, คำสั่งเครื่องมือแบบมีโครงสร้าง และงาน GUI อัตโนมัติ (พร้อมมอนิเตอร์)
วิศวกรรมซอฟต์แวร์และผู้ช่วยโค้ด: สร้าง/แปลง/ย้ายโค้ด สรุป PR ข้อเสนอการดีบัก — ความแข็งแกร่งบน SWE-bench / HumanEval ทำให้เหมาะกับผู้ช่วยโค้ด
ถาม-ตอบเอกสารและสรุปความ: เข้าใจบริบทลึกสำหรับสัญญา งานวิจัย เอกสารยาว (จับคู่กับ retrieval)
ดึงข้อมูลจากภาพ: ใช้กับการดึง/เข้าใจข้อมูลจากกราฟ/ตารางเมื่อแพลตฟอร์มรองรับภาพอินพุต

วิธีเข้าถึง Claude Sonnet 3.5 API

ขั้นตอนที่ 1: ลงชื่อสมัครเพื่อรับ API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ CometAPI console รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่รายการ API token ในศูนย์ส่วนบุคคล รับโทเค็นคีย์: sk-xxxxx แล้วส่ง

ภาพ

ขั้นตอนที่ 2: ส่งคำขอไปยัง Claude Opus 4.1

เลือกปลายทาง “claude-3-5-sonnet-20241022” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการและโครงสร้าง request body ดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมี Apifox ให้ทดสอบเพื่อความสะดวก แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ base url อยู่ในรูปแบบ Anthropic Messages และ Chat

ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบกลับ ประมวลผลการตอบกลับ API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและยืนยันผลลัพธ์

ประมวลผลการตอบกลับ API เพื่อดึงผลลัพธ์ หลังการประมวลผล API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต

คุณสมบัติพื้นฐาน (สิ่งที่ Claude Sonnet 3.5 มอบให้คุณ)

การให้เหตุผลที่แข็งแกร่งและการปฏิบัติตามคำสั่ง: ปรับจูนสำหรับงานตรรกะหลายขั้นตอนและการถาม-ตอบเอกสาร
เอเจนต์และการใช้เครื่องมือ: สร้างมาเพื่อรองรับการเรียกใช้เครื่องมือที่ทนทานและการจัดวางลำดับงานแบบเอเจนต์ (เช่น การเลือกเครื่องมือ การแก้ไขข้อผิดพลาด) Anthropic ได้เพิ่มความสามารถแบบ public-beta ชื่อ computer-use ที่ทำให้ Claude โต้ตอบกับ GUI (เคอร์เซอร์ การคลิก การพิมพ์) ในมุมมอง “flipbook” ความสามารถนี้ยังเป็นเชิงทดลองแต่โดดเด่นสำหรับการทำงานอัตโนมัติกับงาน GUI
ความสามารถในการเขียนโค้ดที่แข็งแกร่ง: ทำผลงานได้แข่งขันใน HumanEval / SWE-bench (ดู Benchmarks)
การจัดการด้านความปลอดภัยและความเป็นส่วนตัว: Anthropic เน้นการฝึกแบบให้ความสำคัญกับความปลอดภัยและดีฟอลต์ที่ปลอดภัยยิ่งขึ้นในตระกูล Claude

รายละเอียดทาง技术ของ Claude 3.5 Sonnet

มัลติโหมด: รองรับข้อความ + รูปภาพ (Vision API รองรับรูปแบบ base64 หรือ URL) รวมถึงแผนภูมิ/กราฟและการถามตอบเชิงภาพ
บริบทยาว: หน้าต่างบริบทที่เผยแพร่ประมาณ ~200k โทเค็น สำหรับเอกสารยาวและการวิเคราะห์หลายไฟล์
การให้เหตุผลและการเขียนโค้ดที่แข็งแกร่งกว่ารุ่นกลางก่อนหน้า: ปรับปรุงเป้าหมายบนเบนช์มาร์กสำหรับนักพัฒนา (ดู Benchmarks)
รองรับเครื่องมือ/เอเจนต์: Messages API รองรับแพตเทิร์นการใช้เครื่องมือ (รันโค้ด ดึงเว็บ เอเจนต์สไตล์ “computer use”) และเอาต์พุต JSON เชิงโครงสร้างเพื่อการอินทิเกรตที่ทนทาน
แนวทางการฝึกที่ให้ความสำคัญกับความปลอดภัย: สอดคล้องหลักการ Constitutional AI และเทคนิคตัวกรอง/ป้องกันเพิ่มเติม

ผลงานบนเบนช์มาร์กของ Claude 3.5 Sonnet

BIG-Bench-Hard (3-shot CoT / รายงานโดย Sonnet): ~93.1% — สะท้อนความสามารถในการให้เหตุผลหลายขั้นตอนที่แข็งแกร่งบนชุด BIG-Bench-Hard ตามที่ผู้ขาย/พาร์ตเนอร์รายงาน
HumanEval (ความถูกต้องของโค้ด): ~93–94% (คะแนน HumanEval ระดับแนวหน้าตามข้อมูลของ Anthropic/GitHub Copilot) จัดอยู่ในกลุ่มผลงานสูงบนการทดสอบสังเคราะห์โปรแกรมมาตรฐาน
SWE-bench (การโค้ดเชิงเอเจนต์/แก้ปัญหา GitHub แบบ “Verified”): ~49% (Sonnet ปรับปรุงจากรุ่นก่อนบนงาน SWE-bench Verified) หมายเหตุ: SWE-bench เน้นการแก้ปัญหาบน GitHub จริง จึงไวต่อสไตล์พรอมป์ตและสภาพแวดล้อม/เครื่องมือ

ข้อจำกัดและความเสี่ยงที่ทราบของ Claude 3.5 Sonnet

ภาพหลอน/ข้อเท็จจริงผิดพลาด: ลดบางโหมดล้มเหลวเมื่อเทียบรุ่นเก่า แต่ยังอาจให้ข้อมูลผิด โดยเฉพาะข้อมูลเฉพาะทางหรือข่าวล่าสุด ควรใช้การเรียกคืน/RAG และการยืนยันสำหรับงานความเสี่ยงสูง
ฟีเจอร์เชิงทดลอง: ความสามารถ computer-use เป็น public beta และยังผิดพลาดได้ (มองหน้าจอแบบ flipbook; เหตุการณ์ UI ระยะสั้นอาจพลาด) ไม่ควรพึ่งโดยไม่มีการมอนิเตอร์ที่เข้มงวดในงานวิกฤตหรือจับเวลาแน่น
อคติและการ์ดเรลความปลอดภัย: รับการปรับจูนสไตล์ปลอดภัยของ Anthropic ซึ่งลดผลลัพธ์ไม่ปลอดภัยหลายแบบ แต่บางครั้งอาจปฏิเสธหรือกรองในกรณีคลุมเครือ
ข้อจำกัดเชิงปฏิบัติการ: โควตาโทเค็น อัตราเรียก ราคา และพื้นที่ให้บริการต่างกันตามแพลตฟอร์ม (Anthropic direct, Bedrock, Vertex AI) ควรปักเวอร์ชันและตรวจโควตาก่อนใช้งานจริง

การเปรียบเทียบกับ gpt 4o และ Claude 4

เทียบกับ GPT-4 / GPT-4o (OpenAI): Sonnet มักรายงานคะแนนสูงกว่าในเบนช์มาร์กการให้เหตุผลหลายขั้นและความถูกต้องของโค้ด (เช่น HumanEval / BIG-Bench ตามข้อมูลผู้ขาย) ขณะที่รุ่น GPT ยังแข่งขันได้ในงานคณิต/CoT และเครื่องมือ (พร้อมสมดุล latency/ค่าใช้จ่ายที่ต่างกัน) ผลจริงขึ้นกับเบนช์มาร์ก
เทียบกับ Opus / Claude 4 ของ Anthropic เอง: Opus / Claude 4 (และ Sonnet รุ่นหลัง) อาจเหนือกว่าในงานซับซ้อนที่สุดที่ใช้คอมพิวต์มาก; Sonnet ยังคงน่าสนใจสำหรับเวิร์กโฟลว์เชิงเอเจนต์ที่ต้องสมดุลต้นทุน/ความหน่วง

กรณีใช้งานในการผลิตที่พบบ่อย

ระบบอัตโนมัติเชิงเอเจนต์: จัดการเครื่องมือ, ตรีอาจทิกเก็ต, คำสั่งเครื่องมือแบบมีโครงสร้าง และงาน GUI อัตโนมัติ (พร้อมมอนิเตอร์)
วิศวกรรมซอฟต์แวร์และผู้ช่วยโค้ด: สร้าง/แปลง/ย้ายโค้ด สรุป PR ข้อเสนอการดีบัก — ความแข็งแกร่งบน SWE-bench / HumanEval ทำให้เหมาะกับผู้ช่วยโค้ด
ถาม-ตอบเอกสารและสรุปความ: เข้าใจบริบทลึกสำหรับสัญญา งานวิจัย เอกสารยาว (จับคู่กับ retrieval)
ดึงข้อมูลจากภาพ: ใช้กับการดึง/เข้าใจข้อมูลจากกราฟ/ตารางเมื่อแพลตฟอร์มรองรับภาพอินพุต

วิธีเข้าถึง Claude Sonnet 3.5 API

ขั้นตอนที่ 1: ลงชื่อสมัครเพื่อรับ API Key

ภาพ

cometapi-3-5-sonnet
claude-3-5-sonnet-20240620	เปิดตัวครั้งแรกของ Claude 3.5 Sonnet (การเปิดตัวครั้งแรกของตระกูล Claude 3.5)
claude-3-5-sonnet-20241022	Anthropic ประกาศ Claude 3.5 Sonnet รุ่นอัปเกรด (ปรับปรุงด้านการเขียนโค้ด/การมองเห็น และอัปเดตรายละเอียดด้านราคา).
claude-3-5-sonnet-latest
cometapi-3-5-sonnet

cometapi-3-5-sonnet
claude-3-5-sonnet-20240620	เปิดตัวครั้งแรกของ Claude 3.5 Sonnet (การเปิดตัวครั้งแรกของตระกูล Claude 3.5)
claude-3-5-sonnet-20241022	Anthropic ประกาศ Claude 3.5 Sonnet รุ่นอัปเกรด (ปรับปรุงด้านการเขียนโค้ด/การมองเห็น และอัปเดตรายละเอียดด้านราคา).
claude-3-5-sonnet-latest
cometapi-3-5-sonnet

Claude 3.5 Sonnet

คุณสมบัติพื้นฐาน (สิ่งที่ Claude Sonnet 3.5 มอบให้คุณ)

รายละเอียดทาง技术ของ Claude 3.5 Sonnet

ผลงานบนเบนช์มาร์กของ Claude 3.5 Sonnet

ข้อจำกัดและความเสี่ยงที่ทราบของ Claude 3.5 Sonnet

การเปรียบเทียบกับ gpt 4o และ Claude 4

กรณีใช้งานในการผลิตที่พบบ่อย

วิธีเข้าถึง Claude Sonnet 3.5 API

ขั้นตอนที่ 1: ลงชื่อสมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง Claude Opus 4.1

ขั้นตอนที่ 3: ดึงและยืนยันผลลัพธ์

คุณสมบัติสำหรับ Claude 3.5 Sonnet

ราคาสำหรับ Claude 3.5 Sonnet

โค้ดตัวอย่างและ API สำหรับ Claude 3.5 Sonnet

รุ่นของ Claude 3.5 Sonnet

โมเดลเพิ่มเติม

Claude 3.5 Sonnet

คุณสมบัติพื้นฐาน (สิ่งที่ Claude Sonnet 3.5 มอบให้คุณ)

รายละเอียดทาง技术ของ Claude 3.5 Sonnet

ผลงานบนเบนช์มาร์กของ Claude 3.5 Sonnet

ข้อจำกัดและความเสี่ยงที่ทราบของ Claude 3.5 Sonnet

การเปรียบเทียบกับ gpt 4o และ Claude 4

กรณีใช้งานในการผลิตที่พบบ่อย

วิธีเข้าถึง Claude Sonnet 3.5 API

ขั้นตอนที่ 1: ลงชื่อสมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง Claude Opus 4.1

ขั้นตอนที่ 3: ดึงและยืนยันผลลัพธ์

คุณสมบัติสำหรับ Claude 3.5 Sonnet

ราคาสำหรับ Claude 3.5 Sonnet

โค้ดตัวอย่างและ API สำหรับ Claude 3.5 Sonnet

รุ่นของ Claude 3.5 Sonnet

โมเดลเพิ่มเติม