Home/Models/Anthropic/Claude 3.5 Sonnet
C

Claude 3.5 Sonnet

Entrada:$2.4/M
Saída:$12/M
Contexto:200K
Saída Máxima:64K
Claude 3.5 Sonnet is a production-grade large language model (LLM) from Anthropic introduced as the first member of the Claude 3.5 family. It was positioned to raise the bar for practical intelligence — improving instruction following, multi-step reasoning and developer/agent workflows — while keeping response latency and cost comparable to Anthropic’s previous “Sonnet” tier.
Novo
Uso comercial
Playground
Visão Geral
Recursos
Preços
API
Versões

Funcionalidades básicas (o que o Claude Sonnet 3.5 oferece)

  • Raciocínio sólido e seguimento de instruções: ajustado para tarefas lógicas de múltiplas etapas e perguntas e respostas sobre documentos.
  • Uso de agentes e ferramentas: projetado para realizar chamadas de ferramentas robustas e orquestração para fluxos de trabalho agentivos (p.ex., seleção de ferramentas, correção de erros). A Anthropic adicionou um recurso em beta público de computer-use que permite ao Claude interagir com uma GUI (cursor, cliques, digitação) em uma visualização de “flipbook”. Este recurso é experimental, mas notável para automatizar tarefas em GUI.
  • Forte capacidade de programação: desempenho competitivo no HumanEval / SWE-bench (ver Benchmarks).
  • Controles gerenciados de segurança e privacidade: a Anthropic continua a enfatizar treinamento com foco em segurança e padrões mais seguros por padrão em toda a linha Claude.

Detalhes técnicos do Claude 3.5 Sonnet

  • Multimodal: lida com texto + imagens (APIs de visão que aceitam imagens em base64 ou URL), incluindo gráficos/diagramas e perguntas e respostas visuais.
  • Contexto longo: janela de contexto publicada de ~200k tokens para documentos extensos e análise de múltiplos arquivos.
  • Raciocínio e programação mais fortes do que modelos intermediários anteriores: ganhos direcionados em benchmarks voltados para desenvolvedores (ver Benchmarks).
  • Suporte a ferramentas/agentes: a Messages API oferece padrões de uso de ferramentas (execução de código, busca na web, agentes no estilo “computer use”) e saídas JSON estruturadas para integrações robustas.
  • Abordagem de treinamento com foco em segurança: construída com os princípios de Constitutional AI da Anthropic e técnicas adicionais de classificadores/proteções.

Desempenho em benchmarks do Claude 3.5 Sonnet

Os benchmarks variam conforme o estilo de prompt, número de exemplos e exata versão do modelo. Abaixo estão valores públicos representativos e amplamente citados (todas as fontes remetem ao fornecedor ou a páginas públicas de benchmark):

  • BIG-Bench-Hard (3-shot CoT / divulgação do Sonnet): ~93.1% — indicando desempenho muito forte de raciocínio em múltiplas etapas na suíte BIG-Bench-Hard, conforme relatado por fornecedor/parceiros.
  • HumanEval (correção de código): ~93–94% (pontuações HumanEval de primeira linha para o Sonnet em materiais da Anthropic/GitHub Copilot). Isso coloca o Sonnet entre os melhores desempenhos em testes padrão de síntese de programas.
  • SWE-bench (codificação agentiva / solução de issues no GitHub, “Verified”): ~49% (o Sonnet melhorou substancialmente em relação a lançamentos anteriores nas tarefas SWE-bench Verified). Observação: o SWE-bench foca na resolução de issues reais do GitHub e é sensível ao estilo de prompt e ao ambiente/ferramentas.

Advertências sobre benchmarks: fornecedores e avaliadores de terceiros usam diferentes templates de prompt, configurações de exemplos e filtros de avaliação. Use esses números como sinais comparativos, não como garantias absolutas para tarefas específicas de produção.


Limitações e riscos conhecidos do Claude 3.5 Sonnet

  • Alucinações/erros factuais: o Sonnet reduz alguns modos de falha em relação a modelos mais antigos, mas ainda pode produzir fatos incorretos ou alucinações, especialmente em tópicos de nicho ou muito recentes. Use retrieval/RAG e verificação para resultados de alto risco.
  • Recursos experimentais: o recurso de computer-use foi lançado em beta público e ainda é sujeito a erros (ele observa a tela como um “flipbook”; eventos de UI de curta duração podem passar despercebidos). Não confie nele para operações de GUI críticas à segurança ou com tempo muito apertado sem monitoramento robusto.
  • Vieses e proteções de segurança: o Sonnet herda o ajuste fino orientado à segurança da Anthropic. Isso reduz muitas saídas inseguras, mas pode levar a recusas conservadoras ou respostas filtradas em casos ambíguos.
  • Limites operacionais: limites de tokens, taxa de requisições, níveis de preço e disponibilidade regional variam por plataforma (Anthropic direta, Bedrock, Vertex AI). Fixe versões e revise cotas da plataforma antes da implantação em produção.

Comparação com gpt 4o e Claude 4

(As comparações são aproximadas e dependem das versões exatas; os números abaixo resumem alegações públicas comparativas.)

  • vs GPT-4 / GPT-4o (OpenAI): o Sonnet frequentemente reporta pontuações mais altas em raciocínio de múltiplas etapas e benchmarks de correção de código (p.ex., HumanEval / variantes do BIG-Bench em materiais do fornecedor), enquanto variantes do GPT permanecem competitivas em tarefas de matemática e cadeia de raciocínio e em ferramentas (e podem ter diferentes compensações de latência/custo). Comparações empíricas variam por benchmark.
  • vs Opus / Claude 4 da própria Anthropic: Opus / Claude 4 (e versões posteriores do Sonnet) podem superar o Sonnet nas tarefas mais complexas e intensivas em computação; o Sonnet continua atraente para fluxos de trabalho agentivos que exigem equilíbrio entre custo e latência.

Recomendação: realize testes A/B curtos e específicos do domínio (mesmos prompts, versões do modelo fixadas) em vez de depender apenas de rankings públicos; a utilidade real na aplicação é específica da tarefa.


Casos de uso representativos em produção

  • Automação agentiva: orquestração de ferramentas, triagem de tickets, chamadas estruturadas de ferramentas e tarefas automatizadas em GUI (com monitoramento).
  • Engenharia de software e assistência a código: geração, transformação, migração de código, sumarização de PRs, sugestões de depuração — a força do Sonnet em SWE-bench / HumanEval o torna uma escolha sólida para assistentes de programação.
  • Perguntas e respostas sobre documentos e sumarização: compreensão de contexto mais profunda para contratos, relatórios de pesquisa e documentos longos (combine com retrieval).
  • Extração de dados a partir de visuais: o Sonnet tem sido usado para extrair/entender conteúdo de gráficos/tabelas onde as plataformas permitem entrada de imagens.

Como acessar a API do Claude Sonnet 3.5

Etapa 1: cadastre-se para obter a chave de API

Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu CometAPI console. Obtenha a credencial de acesso (chave de API) da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

img

Etapa 2: envie solicitações para o Claude Opus 4.1

Selecione o endpoint “claude-3-5-sonnet-20241022” para enviar a solicitação de API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na documentação de API do nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. base url é o formato Anthropic Messages e o formato Chat.

Insira sua pergunta ou solicitação no campo content — é isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.

Etapa 3: recuperar e verificar os resultados

Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.

Recursos para Claude 3.5 Sonnet

Multimodal: suporta texto e imagens (APIs de visão que aceitam imagens em base64 ou por URL), incluindo gráficos/diagramas e resposta a perguntas visuais. Contexto longo: janela de contexto publicada de ~200k tokens para documentos longos e análise de vários arquivos. Anthropic Raciocínio e programação mais fortes do que modelos intermediários anteriores: ganhos direcionados em benchmarks voltados para desenvolvedores (veja Benchmarks). Anthropic +1 Suporte a ferramentas/agentes: a Messages API suporta padrões de uso de ferramentas (execução de código, busca na web, agentes no estilo “computer use”) e saídas JSON estruturadas para integrações robustas. Abordagem de treinamento com prioridade à segurança: construída com os princípios de Constitutional AI da Anthropic e técnicas adicionais de classificadores/salvaguardas.

Preços para Claude 3.5 Sonnet

Explore preços competitivos para Claude 3.5 Sonnet, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como Claude 3.5 Sonnet pode aprimorar seus projetos mantendo os custos gerenciáveis.
Preço do Comet (USD / M Tokens)Preço Oficial (USD / M Tokens)Desconto
Entrada:$2.4/M
Saída:$12/M
Por Segundo:$20
-88%

Código de exemplo e API para Claude 3.5 Sonnet

A API Claude 3.5 Sonnet fornece aos desenvolvedores acesso programático ao avançado modelo de linguagem de IA da Anthropic, oferecendo um equilíbrio entre inteligência e eficiência para integração em diversas aplicações e serviços.

Versões do Claude 3.5 Sonnet

O motivo pelo qual Claude 3.5 Sonnet possui múltiplas versões instantâneas pode incluir fatores como variações na saída após atualizações que exigem versões antigas para consistência, fornecendo aos desenvolvedores um período de transição para adaptação e migração, e diferentes versões correspondentes a endpoints globais ou regionais para otimizar a experiência do usuário. Para diferenças detalhadas entre versões, consulte a documentação oficial.
cometapi-3-5-sonnet
claude-3-5-sonnet-20240620lançamento inicial do Claude 3.5 Sonnet (primeiro lançamento da família Claude 3.5)
claude-3-5-sonnet-20241022Anthropic anunciou uma versão aprimorada do Claude 3.5 Sonnet (melhorias em programação/visão e informações de preços atualizadas).
claude-3-5-sonnet-latest
cometapi-3-5-sonnet

Mais modelos