Home/Models/Anthropic/Claude 3.5 Sonnet
C

Claude 3.5 Sonnet

輸入:$2.4/M
輸出:$12/M
上下文:200K
最大输出:64K
Claude 3.5 Sonnet is a production-grade large language model (LLM) from Anthropic introduced as the first member of the Claude 3.5 family. It was positioned to raise the bar for practical intelligence — improving instruction following, multi-step reasoning and developer/agent workflows — while keeping response latency and cost comparable to Anthropic’s previous “Sonnet” tier.
新
商用
Playground
概览
功能亮点
定价
API
版本

Негізгі мүмкіндіктер (Claude Sonnet 3.5 сізге не береді)

  • Жетілген пайымдау және нұсқауларды орындау: көпқадамды логикалық тапсырмалар мен құжаттар бойынша сұрақ-жауапқа дәл реттелген.
  • Агенттер мен құралдарды пайдалану: агенттік жұмыс ағындары үшін сенімді құрал шақыру және оркестрацияға арналған (мысалы, құрал таңдау, қателерді түзету). Anthropic қоғамдық-бета күйіндегі computer-use мүмкіндігін қосты, ол Claude-ке GUI-мен (“flipbook” көрінісінде курсор, шерту, теру) әрекеттесуге мүмкіндік береді. Бұл эксперименттік, бірақ GUI тапсырмаларын автоматтандыру тұрғысынан маңызды.
  • Күшті кодтау мүмкіндіктері: HumanEval / SWE-bench көрсеткіштері бәсекеге қабілетті (бенчмарктерді қараңыз).
  • Қауіпсіздік пен құпиялылықты басқару: Anthropic қауіпсіздікке басымдық беретін оқыту мен Claude модельдері бойынша қауіпсіз әдепкі параметрлерді ұстануды жалғастырады.

Claude 3.5 Sonnet техникалық сипаттамалары

  • Мультимодальды: мәтін мен суреттерді өңдейді (base64 немесе URL суреттерін қабылдайтын vision API-лері), соның ішінде диаграммалар/графиктер және визуалды сұрақ-жауап.
  • Ұзақ контекст: ұзын құжаттар мен көп файлды талдау үшін жарияланған контекст терезесі — ~200k токен.
  • Бұрынғы орта деңгейлі модельдерге қарағанда күштірек пайымдау және кодтау: әзірлеушілерге бағытталған бенчмарктерде нысаналы өсімдер (төменде қараңыз).
  • Құралдар/агенттерді қолдау: Messages API құралдарды пайдалану үлгілерін (кодты орындату, веб-әкелу, “computer use” стиліндегі агенттер) және интеграцияға ыңғайлы құрылымдалған JSON нәтижелерін қолдайды.
  • Қауіпсіздікке басымдық беретін оқыту тәсілі: Anthropic-тың Constitutional AI қағидаттары және қосымша классификатор/қорғаныс әдістері негізінде жасалған.

Claude 3.5 Sonnet бенчмарк нәтижелері

Бенчмарктер промпт стиліне, мысал санына және нақты модель снэпшотына тәуелді. Төменде вендор немесе жария бенчмарк беттеріне сүйенген кең тараған көрсеткіштер берілген:

  • BIG-Bench-Hard (3-shot CoT / Sonnet есептері): ~93.1% — вендор/серіктес материалдары бойынша BIG-Bench-Hard жинағында көпқадамды пайымдау қабілетінің өте жоғары деңгейін көрсетеді.
  • HumanEval (код дұрыстығы): ~93–94% (Anthropic/GitHub Copilot материалдарында Sonnet үшін жоғары нәтижелер ретінде келтіріледі). Бұл Sonnet-ті стандартты бағдарлама синтезі тесттеріндегі ең үздік орындаушылар қатарына қосады.
  • SWE-bench (агенттік кодтау / GitHub issue шешу, “Verified”): ~49% (Sonnet SWE-bench Verified тапсырмаларында алдыңғы релиздерге қарағанда едәуір ілгерілеген). Ескерту: SWE-bench нақты GitHub мәселелерін шешуге бағытталған және промпт стилі мен орта/құралдарға сезімтал.

Бенчмарктерге қатысты ескертпелер: вендорлар мен үшінші тарап бағалаушылары әртүрлі промпт үлгілерін, мысал параметрлерін және бағалау сүзгілерін қолданады. Бұл сандарды нақты өндірістік тапсырмалар үшін абсолютті кепілдік емес, салыстырмалы бағдар ретінде пайдаланыңыз.

Claude 3.5 Sonnet шектеулері мен белгілі тәуекелдер

  • Галлюцинациялар / фактілік қателер: Sonnet бұрынғы модельдерге қарағанда кейбір қателік түрлерін азайтқанымен, сирек немесе өте жаңа деректерде дұрыс емес не ойдан шығарылған фактілер беруі мүмкін. Маңызды жағдайларда іздеу/RAG және тексеруді қолданыңыз.
  • Эксперименттік мүмкіндіктер: computer-use мүмкіндігі қоғамдық бета ретінде шығарылған және әлі қателікке бейім (экранды “flipbook” ретінде бақылайды; қысқа мерзімді UI оқиғалары байқалмауы ықтимал). Бақылаусыз, қауіпсіздікке сын немесе қатаң тайминг талаптары бар GUI операцияларына оған сүйенбеңіз.
  • Бейімділік пен қауіпсіздік шектеулері: Sonnet Anthropic-тің қауіпсіздікке бағытталған fine-tuning тәсілін мұраға алады. Бұл көптеген қауіпті аутпуттарды азайтады, бірақ кейбір екіұшты жағдайларда сақтық танытып, консервативті бас тартуларға әкелуі мүмкін.
  • Операциялық шектеулер: токен лимиттері, жылдамдық шектеулері, баға деңгейлері және өңірлік қолжетімділік платформаға қарай (Anthropic direct, Bedrock, Vertex AI) әртүрлі. Өндірістік енгізер алдында нұсқаларды бекітіп, платформа квоталарын қарап шығыңыз.

gpt 4o және Claude 4-пен салыстыру

(Салыстырулар жуық және нақты снэпшоттарға тәуелді; төмендегі мәліметтер жария салыстырмалы талаптардың жиынтық нұсқасы.)

  • GPT-4 / GPT-4o (OpenAI) қарсы: кей деректерде Sonnet көпқадамды пайымдау және код дұрыстығы бенчмарктерінде (мысалы, HumanEval / BIG-Bench нұсқалары, вендор материалдары бойынша) жоғарырақ ұпайлар көрсетеді; ал GPT нұсқалары математика мен chain-of-thought тапсырмаларында және құралдар экожүйесінде мықты болып қала береді (латенттілік/құн айырбастары өзге болуы мүмкін). Эмпирикалық салыстырулар бенчмаркке тәуелді.
  • Anthropic-тің өз Opus / Claude 4 нұсқаларына қарсы: Opus / Claude 4 (және кейінгі Sonnet снэпшоттары) ең күрделі, есептеу шығыны жоғары тапсырмаларда Sonnet-тен озып түсуі мүмкін; Sonnet шығын/латенттілік тепе-теңдігін қажет ететін агенттік жұмыс ағындары үшін тартымды.

Ұсыным: жалпыға ортақ лидербордтарға ғана сүйенбей, қысқа, доменге тән A/B тесттерін (бірдей промпттар, бекітілген модель нұсқалары) жүргізіңіз; нақты құндылық тапсырмаға тәуелді.


Өндірістік қолданудың үлгілік сценарийлері

  • Агенттік автоматтандыру: құрал оркестрациясы, тикеттерді триаждау, құрылымдалған құрал шақырулар және GUI тапсырмаларын (бақылаумен) автоматтандыру.
  • Бағдарламалық жасақтама және код көмекшісі: код генерациясы, түрлендіру, миграция, PR қысқаша мазмұндау, жөндеу ұсыныстары — Sonnet-тің SWE-bench / HumanEval күшті жақтары оны код көмекшілері үшін жарамды етеді.
  • Құжаттар бойынша Q&A және қысқаша мазмұндау: келісімшарттар, зерттеу есептері мен ұзын құжаттарды терең түсіну (ретривалмен жұптаңыз).
  • Визуалдардан дерек шығару: платформалар сурет енгізулеріне рұқсат еткенде диаграмма/кесте мазмұнын талдау және түсіну.

Claude Sonnet 3.5 API-не қалай қол жеткізуге болады

1-қадам: API кілтіне тіркелу

cometapi.com сайтына кіріңіз. Егер әлі пайдаланушы болмасаңыз, алдымен тіркеліңіз. CometAPI консолі бетіне кіріңіз. Интерфейстің қолжеткізу тіркелгі дерегі — API кілтін алыңыз. Жеке кабинеттегі API token бөлімінде “Add Token” батырмасын басып, token кілтін алыңыз: sk-xxxxx және жіберіңіз.

сурет

2-қадам: Сұрауларды Claude Opus 4.1-ге жіберу

API сұрауын жіберу үшін “claude-3-5-sonnet-20241022” endpoint-ін таңдаңыз және сұрау денесін орнатыңыз. Сұрау әдісі мен денесін біздің веб-сайттағы API құжатынан алуға болады. Қолайлылық үшін сайтымыз Apifox тестін де ұсынады. <YOUR_API_KEY> орнын аккаунтыңыздағы нақты CometAPI кілтімен алмастырыңыз. Негізгі URL — Anthropic Messages форматы және Chat форматы.

Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель осы өріске жауап қайтарады. Жауапты алу үшін API жауаптарын өңдеңіз.

3-қадам: Нәтижелерді алу және тексеру

API жауаптарын өңдеп, жасалған нәтижені алыңыз. Өңдеуден кейін API тапсырма мәртебесі мен шығыс деректерін қайтарады.

Claude 3.5 Sonnet 的功能

Көпмодальды: мәтін + кескіндермен жұмыс істейді (base64 немесе URL кескіндерін қабылдайтын көру API-лері), оның ішінде диаграммалар/графиктер және визуалды сұрақ-жауап. Ұзақ контекст: ұзын құжаттар мен көп файлды талдау үшін ~200k токендік жарияланған контекст терезесі. Anthropic Алдыңғы орта деңгейлі модельдермен салыстырғанда күштірек пайымдау және код жазу: әзірлеушілерге бағытталған бенчмарк көрсеткіштерінде нысаналы жақсартулар (Benchmarks бөлімін қараңыз). Anthropic +1 Құралдар/агенттерді қолдау: Messages API құралдарды пайдалану үлгілерін қолдайды (кодты орындау, вебтен алу, “computer use” стиліндегі агенттер) және сенімді интеграциялар үшін құрылымдалған JSON шығыстарын ұсынады. Қауіпсіздікке басымдық беретін оқыту тәсілі: Anthropic’s Constitutional AI қағидаттары және қосымша классификатор/қорғау тәсілдері негізінде жасалған.

Claude 3.5 Sonnet 的定价

查看 Claude 3.5 Sonnet 的竞争性定价,满足不同预算与使用需求,灵活方案确保随需求扩展。
Comet 价格 (USD / M Tokens)官方定价 (USD / M Tokens)折扣
輸入:$2.4/M
輸出:$12/M
每秒:$20
-88%

Claude 3.5 Sonnet 的示例代码与 API

Claude 3.5 Sonnet API әзірлеушілерге Anthropic компаниясының жетілдірілген ЖИ тілдік моделіне бағдарламалық деңгейде қол жеткізу мүмкіндігін береді, әрі әртүрлі қосымшалар мен қызметтерге кіріктіру үшін зияткерлік мүмкіндіктер мен тиімділіктің теңгерімін ұсынады.

Claude 3.5 Sonnet 的版本

Claude 3.5 Sonnet 可能存在多个快照,原因包括:更新后保持一致性需要保留旧版、给开发者留出迁移窗口,以及全球/区域端点提供的优化差异。具体差异请参考官方文档。
cometapi-3-5-sonnet
claude-3-5-sonnet-20240620Claude 3.5 Sonnet-тің алғашқы шығарылымы (Claude 3.5 отбасындағы алғашқы іске қосылу)
claude-3-5-sonnet-20241022Anthropic жаңартылған Claude 3.5 Sonnet-ті жариялады (кодтау мен көру мүмкіндіктеріне жақсартулар және бағаға қатысты жаңартылған ескертпелер).
claude-3-5-sonnet-latest
cometapi-3-5-sonnet

更多模型