Claude Haiku 4.5 هو نموذج لغوي مُحسَّن لغرض محدّد ومن فئة أصغر من Anthropic، أُصدر في منتصف أكتوبر 2025. يتموضع كخيار سريع ومنخفض التكلفة ضمن سلسلة Claude مع الحفاظ على قدرات قوية في مهام مثل البرمجة، وتنظيم الوكلاء، وتدفقات عمل "استخدام الحاسوب" التفاعلية، مع تمكين إنتاجية أعلى بكثير وتكلفة وحدة أقل لنشره على مستوى المؤسسات.
الميزات الرئيسية
- السرعة وكفاءة التكلفة: يوصف Haiku 4.5 بأنه أسرع بأكثر من الضعف من Sonnet 4 وبنحو ثلث التكلفة مقارنة بـ Sonnet 4 (وأرخص بكثير من Opus)، ما يجعله جذاباً للاستخدام واسع النطاق.
- التفكير الممتد: أول نموذج Haiku يدعم التفكير الممتد (تفكير مُلخّص/متداخل، وحصص تفكير قابلة للضبط) لتحقيق استدلال متعدد الخطوات أعمق مع موازنة زمن الاستجابة.
- الأدوات واستخدام الحاسوب: دعم كامل لأدوات Claude (bash، وتنفيذ الشيفرة، ومحرر النصوص، والبحث على الويب، وأتمتة استخدام الحاسوب). مصمم لـ تدفقات عمل قائمة على الوكلاء وهياكل الوكلاء الفرعيين.
- نافذة سياق كبيرة: سعة سياق 200k رمز (مع خيارات سياق 1M متاحة على النماذج الأكبر كإصدار تجريبي لفئات نماذج أخرى).
التفاصيل التقنية
- بيانات التدريب ونقطة الإيقاف: جرى تدريب Haiku 4.5 على مزيج مملوك من بيانات عامة ومرخّصة مع نقطة إيقاف للتدريب حول فبراير 2025.
- يتم دعم التفكير الممتد (وضع استدلال هجين) بحيث يمكن للنموذج مقايضة زمن الاستجابة باستدلال أعمق عند الطلب.
- نافذة السياق عند الإطلاق هي 200,000 رمز، والنموذج مدرك للسياق بشكل صريح (يتتبع مقدار ما تم استخدامه من النافذة).
- الأداء/معدل الإنتاجية: تقارير المجتمع المبكرة واختبارات Anthropic تشير إلى OTPS مرتفع جداً (output tokens/sec) وسرعات آنية تقريبية ~200+ tokens/sec في بعض الاختبارات الداخلية/المبكرة — أسرع بكثير من العديد من النماذج المتوسطة المماثلة.
أداء الاختبارات المعيارية
SWE-Bench (البرمجة): سجّل Haiku 4.5 ~73.3% على SWE-Bench Verified — نتيجة تشير Anthropic إلى أنها تضع Haiku 4.5 بين أفضل نماذج البرمجة عالمياً ضمن فئته.

اختبارات الطرفية/سطر الأوامر/الأدوات: أبلغت Anthropic عن ~41% على Terminal-Bench (المُركّز على سطر الأوامر) ونتائج قابلة للمقارنة مع Sonnet 4 وعدة نماذج منافسة من الفئة المتوسطة على العديد من اختبارات استخدام الأدوات.
اتباع التعليمات ونصوص الشرائح: أمثلة Anthropic الداخلية تزعم أن Haiku 4.5 تفوق على نماذج سابقة في بعض مهام اتباع التعليمات (مثال: توليد نصوص الشرائح: 65% مقابل 44% لنموذج مميز سابق في معيارهم).
مهام الأتمتة/الوكلاء في العالم الحقيقي: تقييمات طرف ثالث ومتبنون مبكرون يبلّغون عن معدلات نجاح تنافسية في مهام واجهات المستخدم/الوكلاء المؤتمتة (مثلاً، على شاكلة OSWorld أو معايير الوكيل التي تُظهر ≈50% نجاح في أتمتة معقدة في بعض الاختبارات)، ما يبرهن الفاعلية لتدفقات عمل على نطاق واسع رغم وجود أنماط فشل غير بسيطة.

القيود وملاحظات السلامة
- ليس نموذجاً دافعاً لحدود المجال: تصنّف Anthropic Haiku 4.5 صراحةً على أنه ليس حدّياً؛ إنه مُحسَّن للكفاءة بدلاً من دفع الحد الأقصى للتطور التقني. (Anthropic)
- سلوك متقطع في المواضيع الحساسة: في بعض المطالبات العلمية/السلامة الحيوية قد يقدّم Haiku 4.5 أحياناً معلومات عالية المستوى مع محاذير بدلاً من رفض صارم؛ تشير Anthropic إلى أن ذلك مجال قيد التحسين المستمر.
- التفكير الممتد قد يغيّر السلوك (إذ يزيد أحياناً من عدم التناسق في الردود).
حالات الاستخدام الموصى بها
- برمجة قائمة على الوكلاء وتنظيم متعدد الوكلاء: وكلاء فرعيون سريعون، إعادة هيكلة تكرارية للشيفرة، اختبارات تلقائية وتوليد ترقيعات. (ملائم جداً.)
- تدفقات عمل عملاء لحظية وعالية الحجم: مساعدين للمحادثة، أتمتة داخلية حيث تكلفة الطلب مهمة. (ملائم جداً.)
- تدفقات عمل ممكّنة بالأدوات والتحكم بالحاسوب: أتمتة مهام GUI/CLI، تدفقات عمل المستندات وسلاسل الأدوات حيث يفيد انخفاض الكمون. (ملائم جداً.)
- غير مُوصى به (دون ضوابط): الأدوار المستقلة التي تتطلب تصميم تسلسلات علمية على مستوى الحدود أو مهام أمان حيوي عالية الضمان. (يُرجى الحذر.)