Claude Haiku 4.5 to celowo zoptymalizowany, kompaktowy model językowy firmy Anthropic, wydany w połowie października 2025 r. Jest pozycjonowany jako opcja szybka, niskokosztowa w rodzinie Claude, która zachowuje silne możliwości w zadaniach takich jak programowanie, orkiestracja agentów oraz interaktywne przepływy pracy „computer-use”, jednocześnie umożliwiając znacznie wyższą przepustowość i niższy koszt jednostkowy w wdrożeniach korporacyjnych.
Kluczowe funkcje
- Szybkość i opłacalność: Haiku 4.5 jest opisywany jako ponad dwa razy szybszy niż Sonnet 4 i około jedną trzecią kosztu Sonnet 4 (i znacznie tańszy niż Opus), co czyni go atrakcyjnym do zastosowań na dużą skalę.
- Extended thinking: pierwszy model Haiku wspierający extended thinking (streszczone/przeplatane myślenie, konfigurowalne budżety myślenia) dla głębszego, wieloetapowego rozumowania przy zachowaniu równowagi z opóźnieniem.
- Narzędzia i użycie komputera: pełne wsparcie dla narzędzi Claude (bash, wykonywanie kodu, edytor tekstu, wyszukiwanie w sieci oraz automatyzacja computer-use). Zaprojektowany pod agentowe przepływy pracy i architektury subagentowe.
- Duże okno kontekstu: 200k tokenów okno kontekstu (z opcjami 1M kontekstu dostępnych w wersji beta dla większych modeli innych klas).
Szczegóły techniczne
- Dane treningowe i data odcięcia: Haiku 4.5 został wytrenowany na zastrzeżonej mieszance danych publicznych i licencjonowanych z datą odcięcia około lutego 2025 r.
- Extended-thinking (hybrydowy tryb rozumowania) jest wspierany, dzięki czemu model może zamieniać opóźnienie na głębsze rozumowanie, gdy zostanie o to poproszony.
- Okno kontekstu w momencie wydania to 200,000 tokenów, a model jest wyraźnie świadomy kontekstu (śledzi, jaka część okna została wykorzystana).
- Wydajność/przepustowość: wczesne raporty społeczności i testy Anthropic wskazują na bardzo wysokie OTPS (tokenów wyjściowych/s) i anegdotyczne prędkości około ~200+ tokenów/s w niektórych testach wewnętrznych/wczesnych — znacznie szybsze niż wiele porównywalnych modeli średniej klasy.
Wydajność w benchmarkach
SWE-Bench (kodowanie): Haiku 4.5 uzyskał wynik ~73.3% na SWE-Bench Verified — wynik, który Anthropic podkreśla jako lokujący Haiku 4.5 wśród najlepszych na świecie modeli do kodowania w swojej klasie.

Terminal / wiersz poleceń / testy narzędziowe: Anthropic podał ~41% na Terminal-Bench (skupionym na wierszu poleceń) oraz wyniki porównywalne z Sonnet 4 i kilkoma konkurencyjnymi modelami średniej klasy na wielu benchmarkach użycia narzędzi.
Podążanie za instrukcjami i tekst slajdów: wewnętrzne przykłady Anthropic wskazują, że Haiku 4.5 przewyższył wcześniejsze modele w niektórych zadaniach podążania za instrukcjami (np. generowanie tekstu slajdów: 65% vs 44% dla wcześniejszego modelu premium w ich benchmarku).
Automatyzacja w praktyce / zadania agentowe: oceny stron trzecich i wczesnych użytkowników raportują konkurencyjne współczynniki sukcesu w zautomatyzowanych zadaniach UI/agentowych (na przykład benchmarki w stylu OSWorld lub agentowe raportujące ≈50% sukcesu w złożonej automatyzacji w niektórych testach), co pokazuje przydatność do skalowanych przepływów pracy, choć z istotnymi trybami błędów.

Ograniczenia i uwagi dotyczące bezpieczeństwa
- Nie jest modelem z czołówki: Anthropic wyraźnie klasyfikuje Haiku 4.5 jako nieprzesuwający granic; jest zoptymalizowany pod kątem efektywności, a nie ustanawiania absolutnego stanu sztuki. (Anthropic)
- Sporadyczne zachowanie w tematach wrażliwych: w niektórych naukowych/związanych z biobezpieczeństwem promptach Haiku 4.5 czasem zwraca informacje wysokopoziomowe z zastrzeżeniami zamiast kategorycznych odmów; Anthropic wskazuje to jako obszar dalszych ulepszeń.
- Extended-thinking może zmieniać zachowanie (czasem zwiększa asymetrię odpowiedzi).
Rekomendowane zastosowania
- Programowanie agentowe i orkiestracja wieloagentowa: szybkie subagenty, iteracyjny refaktoring kodu, autotesty i generowanie poprawek. (Dobre dopasowanie.)
- Przepływy obsługi klienta w czasie rzeczywistym i na dużą skalę: asystenci czatowi, automatyzacja wewnętrzna, gdzie istotny jest koszt na żądanie. (Dobre dopasowanie.)
- Przepływy pracy z narzędziami i kontrolą komputera: automatyzacja GUI/CLI, przepływy dokumentów i łańcuchy narzędzi, gdzie niskie opóźnienie pomaga. (Dobre dopasowanie.)
- Niezalecane (bez kontroli): samodzielne role wymagające projektowania sekwencji naukowych na poziomie czołowym lub zadań z zakresu biobezpieczeństwa o wysokich wymaganiach pewności. (Zachować ostrożność.)