Home/Models/Anthropic/Claude 3.5 Sonnet
C

Claude 3.5 Sonnet

入力:$2.4/M
出力:$12/M
文脈:200K
最大出力:64K
Claude 3.5 Sonnet is a production-grade large language model (LLM) from Anthropic introduced as the first member of the Claude 3.5 family. It was positioned to raise the bar for practical intelligence — improving instruction following, multi-step reasoning and developer/agent workflows — while keeping response latency and cost comparable to Anthropic’s previous “Sonnet” tier.
新着
商用利用
Playground
概要
機能
料金プラン
API
バージョン

基本機能(Claude Sonnet 3.5 が提供するもの)

  • 強力な推論能力と指示追従性: 複数ステップの論理タスクやドキュメントのQ&Aに最適化。
  • エージェント/ツールの活用: エージェント型ワークフローにおける堅牢なツール呼び出しとオーケストレーション(例:ツール選択、エラー修正)に対応。Anthropic はパブリックベータの computer-use 機能を追加し、Claude が“フリップブック”ビューでGUI(カーソル、クリック、入力)と対話できるようにしました。これは実験的ながら、GUIタスクの自動化に有用です。
  • 強力なコーディング能力: HumanEval / SWE-bench で競争力のある成績(ベンチマーク参照)。
  • 管理された安全性とプライバシー管理: Anthropic は Claude モデル全体で、安全重視の学習とより安全なデフォルトを継続して重視。

Claude 3.5 Sonnet の技術詳細

  • マルチモーダル: テキスト+画像に対応(base64 または URL 画像を受け付けるビジョンAPI)。グラフ/チャートや視覚的Q&Aにも対応。
  • 長いコンテキスト: 長文ドキュメントや複数ファイル解析向けに公開コンテキストウィンドウは ~200k tokens。
  • 推論とコーディングの強化(従来の中位モデル比):開発者向けベンチマークでの向上(ベンチマーク参照)。
  • ツール/エージェント対応: Messages API がツール利用パターン(コード実行、Web取得、“computer use”スタイルのエージェント)と、堅牢な統合向けの構造化JSON出力をサポート。
  • セーフティファーストの学習アプローチ: Anthropic の Constitutional AI 原則と追加の分類器/セーフガード技術に基づいて構築。

Claude 3.5 Sonnet のベンチマーク性能

ベンチマークはプロンプト形式、ショット数、モデルのスナップショットにより変動します。以下は代表的で広く引用される公開数値です(出典はベンダーまたは公開ベンチマークページにリンク)。

  • BIG-Bench-Hard(3-shot CoT/Sonnet報告): ~93.1% — ベンダー/パートナーの掲載によれば、BIG-Bench-Hard で非常に強力な多段推論性能を示します。
  • HumanEval(コード正確性): ~93–94%(Anthropic/GitHub Copilot 資料で Sonnet のトップクラスの HumanEval スコアが報告)。標準的なプログラム合成コードテストで最上位の一角に位置付けられます。
  • SWE-bench(エージェント型コーディング/GitHub課題解決、“Verified”): ~49%(SWE-bench Verified タスクで、従来版に比べ Sonnet は大幅に改善)。注:SWE-bench は実環境のGitHub課題解決に焦点を当て、プロンプトや環境/ツールに敏感です.

ベンチマークの注意点: ベンダーや第三者評価者は異なるプロンプトテンプレート、ショット設定、評価フィルタを用いています。これらの数値は比較のための指標であり、特定の本番タスクに対する絶対的保証ではありません。


Claude 3.5 Sonnet の制限事項と既知のリスク

  • 幻覚/事実誤り: 旧モデルに比べて一部の失敗モードは減少していますが、特にニッチまたは極めて最新の事実では誤りや幻覚が発生し得ます。高リスクの出力にはリトリーバル/RAGと検証を併用してください。
  • 実験的機能: computer-use 機能はパブリックベータとして提供されており、依然としてエラーが発生しやすい(画面をフリップブック的に観測するため、短時間のUIイベントを見逃す可能性)。堅牢な監視なしに、安全が重要または厳密なタイミングが要求されるGUI操作に依存しないでください。
  • バイアスと安全ガードレール: Sonnet は Anthropic の安全志向のファインチューニングを継承しています。多くの不適切出力が抑制される一方、曖昧なケースでは慎重な拒否やフィルタリングされた回答となる場合があります。
  • 運用上の制約: トークン上限、レート制限、料金階層、地域提供状況はプラットフォーム(Anthropic 直、Bedrock、Vertex AI)により異なります。本番導入前にバージョン固定とプラットフォームのクォータ確認を行ってください。

gpt 4o および Claude 4 との比較

(比較は概算で、具体的なスナップショットに依存します。以下の数値は公開された比較主張の要約です。)

  • vs GPT-4 / GPT-4o(OpenAI): Sonnet は多段推論やコード正確性のベンチマーク(例:ベンダー資料の HumanEval/BIG-Bench 系)でより高いスコアが報告されることが多い一方、GPT 系は数学や思考過程タスク、ツール面で競争力を維持(レイテンシ/コストのトレードオフは異なる場合あり)。実測比較はベンチマークにより変動します。
  • vs Anthropic の Opus/Claude 4: Opus/Claude 4(および後期の Sonnet スナップショット)は、より複雑で計算負荷の高いタスクで Sonnet を上回る場合があります。一方、Sonnet はコスト/レイテンシのバランスが重要なエージェント型ワークフローで魅力的です。

推奨: 公開リーダーボードだけに依存せず、短時間のドメイン特化A/Bテスト(同一プロンプト、バージョン固定)を実施してください。実際の有用性はタスク依存です。


代表的な本番ユースケース

  • エージェント型自動化: ツールのオーケストレーション、チケットのトリアージ、構造化ツール呼び出し、GUIタスクの自動化(監視付き)。
  • ソフトウェアエンジニアリング/コード支援: コード生成、変換、移行、PR要約、デバッグ提案—SWE-bench/HumanEval における強みから、コーディングアシスタントとして有力。
  • ドキュメントQ&Aと要約: 契約書、調査レポート、長文ドキュメントのより深い文脈理解(リトリーバル併用)。
  • ビジュアルからのデータ抽出: 画像入力を許すプラットフォームにおいて、グラフ/表の内容抽出・理解に活用。

Claude Sonnet 3.5 API の利用方法

ステップ 1: API キーの取得

cometapi.com にログインしてください。まだユーザーでない場合は先に登録してください。CometAPI console にサインインします。インターフェースのアクセス認証である API キーを取得します。Personal Center の API token で “Add Token” をクリックし、トークンキー: sk-xxxxx を取得して送信します。

img

ステップ 2: Claude Opus 4.1 にリクエストを送信

API リクエストを送信する際は “claude-3-5-sonnet-20241022” エンドポイントを選択し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントから取得できます。利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。base url は [Anthropic Messages] 形式と [Chat] 形式です。

content フィールドに質問またはリクエストを挿入します—モデルはこの内容に応答します。API レスポンスを処理して生成された回答を取得します。

ステップ 3: 結果の取得と検証

API レスポンスを処理して生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。

Claude 3.5 Sonnetの機能

マルチモーダル: テキストと画像に対応(base64 や URL 画像を受け付けるビジョン API)で、チャート/グラフや視覚的な質問応答を含む。 長いコンテキスト: 長文ドキュメントや複数ファイル分析向けに、~200k トークンのコンテキストウィンドウを公開。 Anthropic 従来の中位モデルよりも強力な推論とコーディング: 開発者向けベンチマークでの指標向上を狙った最適化(Benchmarks を参照)。 Anthropic +1 ツール/エージェントのサポート: Messages API はツール利用パターン(コード実行、Web 取得、“computer use” スタイルのエージェント)と、堅牢な統合のための構造化 JSON 出力をサポート。 安全第一の学習アプローチ: Anthropic の Constitutional AI の原則と追加の分類器/セーフガード技術で構築。

Claude 3.5 Sonnetの料金

Claude 3.5 Sonnetの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。Claude 3.5 Sonnetがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。
コメット価格 (USD / M Tokens)公式価格 (USD / M Tokens)割引
入力:$2.4/M
出力:$12/M
毎秒:$20
-88%

Claude 3.5 SonnetのサンプルコードとAPI

Claude 3.5 Sonnet APIは、Anthropicの高度なAI言語モデルへのプログラムによるアクセスを開発者に提供し、知性と効率のバランスが取れているため、さまざまなアプリケーションやサービスへの統合に適しています。

Claude 3.5 Sonnetのバージョン

Claude 3.5 Sonnetに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。
cometapi-3-5-sonnet
claude-3-5-sonnet-20240620Claude 3.5 Sonnet の初回リリース(Claude 3.5 ファミリーとして初のローンチ)
claude-3-5-sonnet-20241022Anthropic が改良版 Claude 3.5 Sonnet を発表(コーディング/ビジョンの改善および価格に関する注記の更新)。
claude-3-5-sonnet-latest
cometapi-3-5-sonnet

その他のモデル