Claude Haiku 4.5 ist ein zweckoptimiertes Sprachmodell der kleineren Klasse von Anthropic, veröffentlicht Mitte Oktober 2025. Es ist als schnelle, kostengünstige Option innerhalb der Claude-Produktreihe positioniert, die starke Fähigkeiten bei Aufgaben wie Programmierung, Agenten-Orchestrierung und interaktiven „computer-use“-Workflows bewahrt und zugleich für Unternehmenseinsätze deutlich höheren Durchsatz und geringere Stückkosten ermöglicht.
Wichtige Funktionen
- Geschwindigkeit & Kosteneffizienz: Haiku 4.5 wird als mehr als doppelt so schnell wie Sonnet 4 und etwa ein Drittel so teuer wie Sonnet 4 beschrieben (und deutlich günstiger als Opus), was es für den skalierten Einsatz attraktiv macht.
- Erweitertes Denken: Erstes Haiku-Modell mit Unterstützung für erweitertes Denken (zusammengefasste/verschachtelte Gedanken, konfigurierbare Denkbudgets) für tiefere mehrstufige Schlussfolgerungen bei gleichzeitiger Balance der Latenz.
- Tools & computer use: Vollständige Unterstützung für Claude-Tools (bash, Code-Ausführung, Texteditor, Websuche und computer-use-Automatisierung). Ausgelegt für agentische Workflows und Sub-Agent-Architekturen.
- Großes Kontextfenster: 200k Token Kontextfenster (mit 1M-Kontextoptionen als Beta für andere Modellklassen verfügbar).
Technische Details
- Trainingsdaten & Cutoff: Haiku 4.5 wurde auf einer proprietären Mischung aus öffentlichen und lizenzierten Daten mit einem Training-Cutoff um Februar 2025 trainiert.
- Erweitertes Denken (ein hybrider Reasoning-Modus) wird unterstützt, sodass das Modell auf Wunsch Latenz gegen tiefere Begründung eintauschen kann.
- Kontextfenster bei Veröffentlichung beträgt 200,000 Token, und das Modell ist ausdrücklich kontextbewusst (es verfolgt, wie viel des Fensters genutzt wurde).
- Leistung / Durchsatz: Frühe Community-Berichte und Tests von Anthropic nennen sehr hohe OTPS (output tokens/sec) und anekdotische Geschwindigkeiten von ~200+ tokens/sec in einigen internen/frühen Tests — weit schneller als viele vergleichbare Mid-Tier-Modelle.
Benchmark-Leistung
SWE-Bench (Coding): Haiku 4.5 erzielte ~73.3% auf SWE-Bench Verified — ein Ergebnis, das laut Anthropic Haiku 4.5 unter die weltweit besten Coding-Modelle seiner Klasse einordnet.

Terminal- / Kommandozeilen- / Tool-Tests: Anthropic berichtete ~41% auf Terminal-Bench (Kommandozeilenfokus) und vergleichbare Ergebnisse zu Sonnet 4 sowie mehreren konkurrierenden Mid-Range-Frontier-Modellen auf vielen Tool-Use-Benchmarks.
Befolgen von Anweisungen & Folientext: Interne Beispiele von Anthropic belegen, dass Haiku 4.5 bei einigen Anweisungsbefolgungsaufgaben besser abschnitt (z. B. Folientext-Generierung: 65% vs 44% gegenüber einem früheren Premium-Modell in deren Benchmark).
Automatisierung in der Praxis / Agentenaufgaben: Drittanbieter-Evaluierungen und frühe Anwender berichten von wettbewerbsfähigen Erfolgsraten bei automatisierten UI-/Agentenaufgaben (zum Beispiel OSWorld-ähnliche oder Agenten-Benchmarks mit ≈50% Erfolg bei komplexer Automatisierung in einigen Tests), was die Nützlichkeit für skalierte Workflows zeigt, wenn auch mit nicht trivialen Fehlermodi.

Einschränkungen & Sicherheitshinweise
- Kein Frontier-Modell: Anthropic klassifiziert Haiku 4.5 ausdrücklich als nicht frontier-advancing; es ist auf Effizienz optimiert, nicht darauf, den absoluten Stand der Technik voranzutreiben. (Anthropic)
- Gelegentliches Verhalten bei sensiblen Themen: In einigen wissenschaftlichen/biosicherheitsbezogenen Prompts gibt Haiku 4.5 bisweilen hochlevelige Informationen mit Vorbehalten statt strikter Verweigerungen zurück; Anthropic markiert dies als einen Bereich mit laufenden Verbesserungen.
- Erweitertes Denken kann das Verhalten verändern (manchmal erhöht es die Asymmetrie in Antworten).
Empfohlene Anwendungsfälle
- Agentisches Programmieren & Multi-Agenten-Orchestrierung: schnelle Sub-Agenten, iterative Code-Refaktorierung, Autotests und Patch-Generierung. (Gut geeignet.)
- Echtzeit-, hochvolumige Kunden-Workflows: Chat-Assistenten, interne Automatisierung, bei der die Kosten pro Anfrage wichtig sind. (Gut geeignet.)
- Toolgestützte Workflows & Computersteuerung: Automatisierung von GUI/CLI-Aufgaben, Dokument-Workflows und Toolchains, bei denen geringe Latenz hilft. (Gut geeignet.)
- Nicht empfohlen (ohne Kontrollen): eigenständige Rollen, die wissenschaftliches Sequenzdesign auf Frontier-Niveau oder Aufgaben mit hohen Biosicherheitsanforderungen erfordern. (Mit Vorsicht verwenden.)