Claude Haiku 4.5 er en formålsoptimalisert språkmodell i småklassen fra Anthropic, lansert i midten av oktober 2025. Den er posisjonert som et raskt, rimelig alternativ i Claude-serien som bevarer sterk kapasitet på oppgaver som koding, agentorkestrering og interaktive “computer-use”-arbeidsflyter, samtidig som den muliggjør langt høyere gjennomstrømning og lavere enhetskostnad for bedriftsutrullinger.
Nøkkelfunksjoner
- Hastighet og kostnadseffektivitet: Haiku 4.5 beskrives som mer enn dobbelt så rask som Sonnet 4 og omtrent en tredel av kostnaden til Sonnet 4 (og mye billigere enn Opus), noe som gjør den attraktiv for bruk i skala.
- Utvidet tenkning: Første Haiku-modell som støtter extended thinking (oppsummerte / innvevde tanker, konfigurerbare tenkebudsjetter) for dypere flerstegsresonnering med balansert latens.
- Verktøy og databruk: Full støtte for Claude-verktøy (bash, kodekjøring, teksteditor, nettsøk og automatisering av “computer-use”). Designet for agentbaserte arbeidsflyter og subagent-arkitekturer.
- Stort kontekstvindu: 200k token kontekstvindu (med 1M-kontekstalternativer tilgjengelig på større modeller som beta for andre modellklasser).
Tekniske detaljer
- Treningsdata og cutoff: Haiku 4.5 er trent på en proprietær miks av offentlige og lisensierte data med en trenings-cutoff rundt februar 2025.
- Extended-thinking (en hybrid resonneringsmodus) støttes slik at modellen kan bytte latens mot dypere resonnering ved behov.
- Kontekstvindu ved lansering er 200,000 tokens, og modellen er eksplisitt kontekstbevisst (den sporer hvor mye av vinduet som er brukt).
- Ytelse / gjennomstrømming: Tidlige rapporter fra miljøet og Anthropic-testing viser svært høy OTPS (utgående tokens/sek) og anekdotiske hastigheter rundt ~200+ tokens/sek i noen interne/tidlige tester — langt raskere enn mange sammenlignbare modeller i mellomklassen.
Benchmark-ytelse
SWE-Bench (koding): Haiku 4.5 oppnådde ~73.3% på SWE-Bench Verified — et resultat Anthropic fremhever som plasserer Haiku 4.5 blant verdens beste kodemodeller i sin klasse.

Terminal / kommandolinje / verktøytester: Anthropic rapporterte ~41% på Terminal-Bench (kommandolinjefokusert) og sammenlignbare resultater med Sonnet 4 og flere konkurrerende mellomklassemodeller på mange verktøybruk-benchmarker.
Instruksjonsfølging og lysbildetekst: interne eksempler fra Anthropic hevder at Haiku 4.5 overgikk tidligere modeller på noen instruksjonsfølgingsoppgaver (f.eks. generering av lysbildetekst: 65% vs 44% for en tidligere premiummodell i deres benchmark).
Automatisering i virkeligheten / agentoppgaver: tredjepartsevalueringer og tidlige brukere rapporterer konkurransedyktige suksessrater på automatiserte UI-/agentoppgaver (for eksempel OSWorld-lignende eller agentbenchmarker som rapporterer ≈50% suksess på kompleks automatisering i noen tester), noe som viser nytte for arbeidsflyter i skala, om enn med ikke-trivielle feilmodi.

Begrensninger og sikkerhetsmerknader
- Ikke en frontier-modell: Anthropic klassifiserer eksplisitt Haiku 4.5 som ikke frontier-fremmende; den er optimalisert for effektivitet fremfor å presse det absolutte «state of the art». (Anthropic)
- Av og til avvik på sensitive temaer: i enkelte vitenskapelige / biosikkerhetsrelaterte forespørsler returnerer Haiku 4.5 iblant høynivåinformasjon med forbehold snarere enn strenge avslag; Anthropic peker på dette som et pågående forbedringsområde.
- Extended-thinking kan endre atferd (det øker noen ganger asymmetrien i svar).
Anbefalte bruksområder
- Agentbasert koding og multiagent-orkestrering: raske subagenter, iterativ refaktorering av kode, autotester og patch-generering. (God match.)
- Sanntids, høyvolums kundearbeidsflyter: chat-assistenter, intern automatisering der kostnad per forespørsel er viktig. (God match.)
- Verktøyaktiverte arbeidsflyter og datamaskinkontroll: automatisering av GUI/CLI-oppgaver, dokumentflyter og verktøykjeder der lav latens hjelper. (God match.)
- Ikke anbefalt (uten kontrolltiltak): selvstendige roller som krever frontier-nivå vitenskapelig sekvensdesign eller oppgaver med høy sikkerhet innen biosikkerhet. (Utvis varsomhet.)