Claude Haiku 4.5 — целевым образом оптимизированная языковая модель меньшего класса от Anthropic, выпущенная в середине октября 2025 года. Она позиционируется как быстрый и недорогой вариант в линейке Claude, который сохраняет высокие способности в задачах, таких как программирование, оркестрация агентов и интерактивные рабочие процессы «computer-use», одновременно обеспечивая значительно более высокую пропускную способность и меньшую удельную стоимость для корпоративных развёртываний.
Ключевые особенности
- Скорость и экономичность: Haiku 4.5 описывается как более чем вдвое быстрее Sonnet 4 и примерно за треть от стоимости Sonnet 4 (и значительно дешевле Opus), что делает её привлекательной для масштабного использования.
- Расширенное мышление: Первая модель Haiku с поддержкой расширенного мышления (сводные / перемежающиеся рассуждения, настраиваемые бюджеты рассуждений) для более глубокого многошагового рассуждения при балансе задержки.
- Инструменты и работа с компьютером: Полная поддержка инструментов Claude (bash, выполнение кода, текстовый редактор, веб-поиск и автоматизация «computer-use»). Разработана для агентных рабочих процессов и архитектур с подагентами.
- Большое контекстное окно: 200k токенов (с вариантами контекста 1M, доступными на более крупных моделях как бета для других классов моделей).
Технические детали
- Данные обучения и дата отсечки: Haiku 4.5 обучалась на проприетарной смеси публичных и лицензированных данных с датой отсечки около февраля 2025 года.
- Поддерживается расширенное мышление (гибридный режим рассуждений), позволяющее при необходимости обменивать задержку на более глубокое рассуждение.
- Контекстное окно на момент релиза — 200,000 токенов, и модель явно осведомлена о контексте (отслеживает, какая часть окна уже использована).
- Производительность / пропускная способность: Ранние отчёты сообщества и тесты Anthropic указывают на очень высокий OTPS (выходных токенов/с) и анекдотические скорости около ~200+ tokens/sec в некоторых внутренних/ранних тестах — значительно быстрее многих сопоставимых моделей среднего класса.
Результаты бенчмарков
SWE-Bench (программирование): Haiku 4.5 набрала ~73.3% на SWE-Bench Verified — результат, который Anthropic отмечает как ставящий Haiku 4.5 в число лучших в мире кодовых моделей своего класса.

Терминал / командная строка / тесты инструментов: Anthropic сообщила о ~41% на Terminal-Bench (ориентирован на командную строку) и сопоставимых результатах с Sonnet 4 и рядом конкурирующих моделей среднего уровня на многих бенчмарках инструментального использования.
Следование инструкциям и текст для слайдов: внутренние примеры Anthropic утверждают, что Haiku 4.5 превзошла предыдущие модели в ряде задач по следованию инструкциям (например, генерация текста для слайдов: 65% против 44% для прежней премиальной модели в их бенчмарке).
Автоматизация в реальном мире / агентные задачи: сторонние оценки и ранние пользователи сообщают о конкурентоспособных показателях успешности на задачах автоматизации UI/агентов (например, бенчмарки в стиле OSWorld показывают ≈50% успеха на сложной автоматизации в некоторых тестах), что демонстрирует полезность для масштабируемых рабочих процессов, хотя и с нетривиальными режимами сбоев.

Ограничения и заметки по безопасности
- Не передовой фронтирный уровень: Anthropic прямо классифицирует Haiku 4.5 как не продвигающую фронтир; она оптимизирована под эффективность, а не под абсолютный передовой уровень. (Anthropic)
- Периодическое поведение на чувствительные темы: в некоторых научных/биобезопасных запросах Haiku 4.5 иногда возвращает информацию высокого уровня с оговорками вместо строгих отказов; Anthropic отмечает это как область для дальнейшего улучшения.
- Расширенное мышление может менять поведение (иногда увеличивает асимметрию ответов).
Рекомендуемые сценарии использования
- Агентное программирование и оркестрация множества агентов: быстрые подагенты, итеративный рефакторинг кода, автотесты и генерация патчей. (Хорошее соответствие.)
- Потоки с клиентами в реальном времени и больших объёмах: чат-ассистенты, внутренняя автоматизация, где важна стоимость на запрос. (Хорошее соответствие.)
- Рабочие процессы с инструментами и управлением компьютером: автоматизация задач GUI/CLI, документооборота и инструментальных цепочек, где важна низкая задержка. (Хорошее соответствие.)
- Не рекомендуется (без контролей): автономные роли, требующие передового уровня проектирования научных последовательностей, или задачи с высокими требованиями к биобезопасности. (Проявляйте осторожность.)