Claude Haiku 4.5 Anthropic کا ایک مقصد کے مطابق بہتر بنایا گیا، چھوٹے درجے کا لینگوئج ماڈل ہے، جو اکتوبر 2025 کے وسط میں ریلیز ہوا۔ یہ Claude لائن اَپ میں تیز، کم لاگت والے آپشن کے طور پر پوزیشنڈ ہے جو کوڈنگ، ایجنٹ آرکیسٹریشن، اور انٹرایکٹو “کمپیوٹر-یوز” جیسے ورک فلو میں مضبوط صلاحیت برقرار رکھتے ہوئے انٹرپرائز ڈپلائمنٹس کے لیے کہیں زیادہ تھروپُٹ اور کم یونٹ لاگت ممکن بناتا ہے۔
کلیدی خصوصیات
- رفتار اور لاگت کی افادیت: Haiku 4.5 کو Sonnet 4 کے مقابلے میں دو گنا سے زیادہ تیز اور لاگت کے لحاظ سے تقریباً ایک تہائی (اور Opus کے مقابلے میں کہیں سستا) بتایا گیا ہے، جس سے یہ بڑے پیمانے کے استعمال کے لیے پرکشش بنتا ہے۔
- وسیع تر غوروفکر: Haiku کا پہلا ماڈل جو وسیع تر غوروفکر (خلاصہ شدہ/مدغم-در-مدغم خیالات، قابل ترتیب سوچ بجٹس) کی سپورٹ دیتا ہے، تاکہ لیٹنسی کا توازن رکھ کر گہری کثیر مرحلہ وار دلیل ممکن ہو۔
- ٹولز اور کمپیوٹر استعمال: Claude ٹولز کی مکمل سپورٹ (bash، code execution، text editor، web search، اور computer-use automation)۔ ایجنٹک ورک فلو اور سب-ایجنٹ آرکیٹیکچرز کے لیے ڈیزائن کیا گیا۔
- وسیع کانٹیکسٹ ونڈو: 200k ٹوکن کانٹیکسٹ ونڈو (جبکہ بڑے ماڈلز میں 1M کانٹیکسٹ آپشنز بطور بیٹا دیگر کلاسز کے لیے دستیاب)۔
تکنیکی تفصیلات
- ٹریننگ ڈیٹا اور کٹ آف: Haiku 4.5 کو عوامی اور لائسنس یافتہ ڈیٹا کے ایک ملکیتی امتزاج پر تربیت دیا گیا، جس کا ٹریننگ کٹ آف تقریباً فروری 2025 کے آس پاس ہے۔
- وسیع تر غوروفکر (ایک ہائبرڈ ریزننگ موڈ) سپورٹڈ ہے، تاکہ ضرورت پر گہری دلیل کے لیے لیٹنسی کے بدلے سوچ کو بڑھایا جا سکے۔
- کانٹیکسٹ ونڈو ریلیز کے وقت 200,000 ٹوکن ہے، اور ماڈل واضح طور پر کانٹیکسٹ سے باخبر ہے (یہ ٹریک کرتا ہے کہ ونڈو کا کتنا حصہ استعمال ہو چکا ہے)۔
- کارکردگی/تھروپُٹ: ابتدائی کمیونٹی رپورٹس اور Anthropic کے ٹیسٹس بہت زیادہ OTPS (آؤٹ پٹ ٹوکنز/سیکنڈ) بتاتے ہیں، اور کچھ اندرونی/ابتدائی ٹیسٹس میں تقریباً ~200+ ٹوکنز/سیکنڈ کی رفتار — بہت سے قابل موازنہ مڈ-ٹیئر ماڈلز سے کہیں تیز۔
بینچ مارک کارکردگی
SWE-Bench (کوڈنگ): Haiku 4.5 نے SWE-Bench Verified پر ~73.3% اسکور کیا — Anthropic کے مطابق یہ نتیجہ Haiku 4.5 کو اپنی کلاس کے بہترین کوڈنگ ماڈلز میں شامل کرتا ہے۔

ٹرمنل/کمانڈ لائن/ٹول ٹیسٹس: Anthropic کے مطابق Terminal-Bench (کمانڈ لائن مرکوز) پر ~41%، اور متعدد ٹول-یوز بینچ مارکس پر Sonnet 4 اور دیگر درمیانی درجے کے فرنٹیئر ماڈلز کے ہم پلہ نتائج۔
انسٹرکشن-فالوونگ اور سلائیڈ ٹیکسٹ: Anthropic کی داخلی مثالوں میں بتایا گیا کہ کچھ انسٹرکشن-فالوونگ ٹاسکس پر Haiku 4.5 نے پچھلے ماڈلز کو پیچھے چھوڑا (مثلاً سلائیڈ ٹیکسٹ جنریشن: ان کے بینچ مارک میں 65% بمقابلہ 44% ایک سابقہ پریمیئم ماڈل کے لیے)۔
ریئل-ورلڈ آٹومیشن/ایجنٹ ٹاسکس: تھرڈ پارٹی جائزوں اور ابتدائی اپنانے والوں کے مطابق خودکار UI/ایجنٹ ٹاسکس پر مقابلہ جاتی کامیابی کی شرحیں (مثال کے طور پر OSWorld طرز یا ایجنٹ بینچ مارکس میں بعض ٹیسٹس پر ≈50% کامیابی)، جو اسکیلڈ ورک فلو کے لیے موزونیت دکھاتی ہیں، اگرچہ بعض ناکامی کے نمونے موجود ہیں۔

حدود اور حفاظتی نوٹس
- فرنٹیئر ماڈل نہیں: Anthropic واضح طور پر Haiku 4.5 کو فرنٹیئر-ایڈوانسنگ نہیں مانتا؛ اسے کارکردگی/افادیت کے لیے آپٹمائز کیا گیا ہے، نہ کہ آرٹ کی انتہائی حدوں کو آگے بڑھانے کے لیے۔ (Anthropic)
- حساس موضوعات پر کبھی کبھار رویہ: بعض سائنسی/بایو-سیفٹی نوعیت کے پرامپٹس میں Haiku 4.5 کبھی کبھار سخت انکار کے بجائے اعلیٰ سطحی معلومات احتیاطی نوٹس کے ساتھ دیتا ہے؛ Anthropic نے اسے بہتری کے عمل میں شامل رکھا ہے۔
- وسیع تر غوروفکر رویّے کو بدل سکتا ہے (بعض اوقات جوابی عدم تقارن میں اضافہ ہو جاتا ہے)۔
تجویز کردہ استعمالات
- ایجنٹک کوڈنگ اور ملٹی-ایجنٹ آرکیسٹریشن: تیز سب-ایجنٹس، تکراری کوڈ ریفیکٹر، آٹو ٹیسٹس اور پیچ جنریشن۔ (Good fit.)
- ریئل ٹائم، ہائی والیوم کسٹمر ورک فلو: چیٹ اسسٹنٹس، اندرونی آٹومیشن جہاں فی-ریکویسٹ لاگت اہم ہو۔ (Good fit.)
- ٹول-فعال ورک فلو اور کمپیوٹر کنٹرول: GUI/CLI ٹاسکس کی آٹومیشن، ڈاکیومنٹ ورک فلو اور ٹول چینز جہاں کم لیٹنسی مددگار ہو۔ (Good fit.)
- سفارش نہیں (بغیر کنٹرولز کے): ایسے خودمختار کردار جو فرنٹیئر-سطح کی سائنسی سیکوئنس ڈیزائن یا اعلیٰ یقین دہانی والی بایو سکیورٹی درکار کریں۔ (Exercise caution.)