Claude Haiku 4.5 — Anthropic компаниясының мақсатқа оңтайландырылған, шағын класты тілдік моделі, 2025 жылғы қазан айының ортасында шығарылған. Ол Claude желісінде жылдам, төмен құнды опция ретінде позицияланған, код жазу, агенттерді үйлестіру және интерактивті «компьютерді пайдалану» жұмыс ағындары сияқты міндеттерде мықты мүмкіндіктерді сақтай отырып, кәсіпорындық орналастырулар үшін әлдеқайда жоғары өткізгіштік пен төмен бірлік құнын қамтамасыз етеді.
Негізгі мүмкіндіктер
- Жылдамдық және құн тиімділігі: Haiku 4.5 Sonnet 4-тен екі есе жылдамырақ және Sonnet 4-тен шамамен үштен бір құнында (Opus-тен әлдеқайда арзан), бұл оны ауқымды пайдалануға тартымды етеді.
- Кеңейтілген ойлау: Бірінші Haiku моделі, кеңейтілген ойлауды қолдайды (қысқартылған/аралас ой, бапталатын ойлау бюджеттері), бұл латенттілік балансын сақтай отырып көпқадамды терең пайымдауға мүмкіндік береді.
- Құралдар және компьютерді пайдалану: Claude құралдарының толық қолдауы (bash, кодты орындау, мәтін өңдегіші, веб-іздеу және компьютерді пайдалану автоматтандыруы). Агенттік жұмыс үрдістері мен суб-агент архитектураларына арналған.
- Үлкен контекст терезесі: 200k токен контекст терезесі (үлкенірек модельдерде 1M контекст опциялары басқа модель кластары үшін бета ретінде қолжетімді).
Техникалық мәліметтер
- Оқыту деректері және шекті мерзім: Haiku 4.5 жария және лицензияланған деректердің меншікті қоспасында оқытылды, оқыту шегі шамамен 2025 жылғы ақпанда.
- Кеңейтілген ойлау (гибридті пайымдау режимі) қолдау табады, сондықтан сұратылғанда латенттілікті терең пайымдауға айырбастауға болады.
- Контекст терезесі релиз кезінде 200,000 токен, және модель айқын контекстке сезімтал (терезенің қаншасы пайдаланылғанын қадағалайды).
- Өнімділік / өткізгіштік: Ерте қауымдастық есептері және Anthropic сынақтары өте жоғары OTPS (output tokens/sec) және кейбір ішкі/ерте тестілерде шамамен ~200+ токен/сек жылдамдықтарын атап өтеді — көптеген салыстырмалы орта деңгейлі модельдерден әлдеқайда жылдам.
Бенчмарк нәтижелері
SWE-Bench (кодинг): Haiku 4.5 SWE-Bench Verified көрсеткішінде ~73.3% набрао — Anthropic бұл нәтижені өз класы үшін әлемдегі ең мықты код жазу модельдерінің қатарына қосатынын атап өтеді.

Терминал / командалық жол / құрал сынақтары: Anthropic Terminal-Bench (командалық жолға бағытталған) бойынша ~41% көрсетті және көптеген құрал-қолдану бенчмарктерінде Sonnet 4-пен және бәсекелес орта деңгейдегі модельдермен салыстырмалы нәтижелерге жетті.
Нұсқауларды орындау және слайд мәтіні: Anthropic-тің ішкі мысалдары Haiku 4.5 бұрынғы модельдерден кейбір нұсқауларды орындау міндеттерінде (мысалы, слайд мәтінін генерациялау: олардың бенчмаркіндегі бұрынғы премиум модельмен салыстырғанда 65% vs 44%) озып түскенін көрсетеді.
Нақты ортадағы автоматтандыру / агент міндеттері: үшінші тарап бағалаулары және ерте пайдаланушылар күрделі автоматтандыру бойынша (мысалы, OSWorld-стиліндегі немесе агент бенчмарктері кейбір тестілерде ≈50% табыс) бәсекеге қабілетті табыс деңгейлерін хабарлайды, бұл масштабталған жұмыс ағындары үшін пайдалы екенін көрсетеді, дегенмен елеусіз емес сәтсіздік режимдері бар.

Шектеулер және қауіпсіздік ескертпелері
- Шекаралық модель емес: Anthropic Haiku 4.5-ті frontier деңгейін ілгерілетпейтін деп нақты жіктейді; ол тиімділікке оңтайланған, абсолюттік алдыңғы қатарды қуалау емес. (Anthropic)
- Сезімтал тақырыптардағы кездейсоқ мінез-құлық: кейбір ғылыми/биоқауіпсіздікке қатысты сұранымдарда Haiku 4.5 кейде қатаң бас тартудың орнына ескертпелері бар жоғары деңгейдегі ақпарат береді; Anthropic бұл бағытты жақсарту үстінде екенін айтады.
- Кеңейтілген ойлау мінез-құлықты өзгерте алады (кейде жауаптардағы асимметрияны арттырады).
Ұсынылатын қолдану сценарийлері
- Агенттік кодинг және көп агентті үйлестіру: жылдам суб-агенттер, итеративті кодты рефакторлау, автотесттер және жамау генерациясы. (Жақсы сәйкес келеді.)
- Нақты уақыттағы, жоғары көлемді тұтынушылық жұмыс ағындары: чат ассистенттері, әр сұраным құны маңызды болатын ішкі автоматтандыру. (Жақсы сәйкес келеді.)
- Құрал-қолдауы бар жұмыс үрдістері және компьютерді басқару: GUI/CLI міндеттерін, құжат жұмыс ағындарын және құралдар тізбектерін автоматтандыру, мұнда төмен латенттілік көмектеседі. (Жақсы сәйкес келеді.)
- Ұсынылмайды (бақылаусыз): frontier деңгейіндегі ғылыми тізбек жобалауын немесе жоғары сенімді биоқауіпсіздік міндеттерін талап ететін дербес рөлдер. (Сақтық танытыңыз.)