آنتراپیک (Anthropic) مدل جدید خود به نام Opus 4.5 را با بهبودهای قابل توجهی در قدرت، بهرهوری و قیمت معرفی کرده است. این مدل با هدف رفع انتقاداتی که به طولانی شدن گفتگوها در مدلهای قبلی Claude وارد میشد، طراحی شده و عملکرد کدنویسی آن نیز ارتقا یافته است. علاوه بر این، بهبودهایی در تجربه کاربری نیز اعمال شده تا Opus 4.5 رقابتپسندتری نسبت به آخرین مدلهای پیشرو OpenAI باشد.
یکی از مهمترین تغییرات برای اکثر کاربران، کاهش احتمال پایان ناگهانی گفتگوها در برنامههای کاربردی (وب، موبایل و دسکتاپ) است. این بهبود در حافظه یکباره در گفتگوها فقط به Opus 4.5 بلکه به تمام مدلهای Claude فعلی در برنامهها اعمال میشود.
کاربرانی که قبلاً با پایان ناگهانی گفتگوها مواجه شده بودند (حتی زمانی که فضای کافی در جلسه و بودجه استفاده هفتگی آنها باقی مانده بود)، به دلیل رسیدن به محدودیت پنجره زمینه (200,000 توکن) با این مشکل روبرو میشدند. برخلاف برخی از پیادهسازیهای مدلهای زبانی بزرگ که در صورت عبور از حداکثر ظرفیت، شروع به حذف پیامهای قبلی از زمینه میکنند، Claude گفتگو را به طور کامل قطع میکرد تا کاربر تجربهای از یک گفتگوی ناسازگار و فراموشکار نداشته باشد.
اکنون، Claude بهطور خودکار اقدام به خلاصهسازی نکات کلیدی از قسمتهای اولیه گفتگو میکند و تلاش میکند اطلاعات غیرضروری را حذف کرده و موارد مهم را حفظ کند. توسعهدهندگانی که از API آنتراپیک استفاده میکنند نیز میتوانند با مدیریت زمینه و فشردهسازی زمینه، از این اصول بهره ببرند.
**عملکرد برجسته Opus 4.5:**
Opus 4.5 اولین مدلی است که به امتیاز دقت بالای 80 درصد (به طور دقیقتر 80.9 درصد) در معیار SWE-Bench Verified دست یافته و از GPT-5.1-Codex-Max (77.9 درصد) و Gemini 3 Pro (76.2 درصد) شرکتهای OpenAI و Google پیشی گرفته است. این مدل بهویژه در بنچمارکهای کدنویسی و استفاده ابزاری عملکرد خوبی دارد، اما هنوز از GPT-5.1 در استدلال بصری (MMMU) عقبتر است.
آنتراپیک همچنین ادعا میکند که Opus 4.5 نسبت به مدلهای Claude قبلی یا مدلهای رقیبی مانند GPT-5.1 و Gemini 3 Pro، کمتر در برابر حملات تزریق پرامپت (prompt injection attacks) آسیبپذیر است. با این حال، هیچکدام از این مدلها عملکرد کاملاً بینقصی در این زمینه ندارند.
در حالی که بهبودهای عملکرد در بنچمارکها قابل توجه هستند، به احتمال زیاد مهمترین پیشرفت Opus 4.5، کارایی بیشتر آن با توکنها است. آنتراپیک گزارش میدهد:
* با تنظیم سطح تلاش متوسط، Opus 4.5 به امتیاز مشابه Sonnet 4.5 در SWE-bench Verified میرسد اما از 76% توکنهای خروجی کمتری استفاده میکند.
* در بالاترین سطح تلاش، Opus 4.5 عملکرد Sonnet 4.5 را تا 4.3 درصد افزایش میدهد – در حالی که از 48% توکنهای کمتری استفاده میکند.
عرضه Opus 4.5 همراه با ویژگیهای جدیدی برای توسعهدهندگان و کاربران نیز هست. به عنوان مثال، پلتفرم توسعهدهنده اکنون شامل یک پارامتر جدید به نام «تلاش» (effort) است که به توسعهدهندگان اجازه میدهد تعادل مورد نظر خود را بین اثربخشی و استفاده از توکنها تنظیم کنند.
همچنین، Claude Code اکنون در برنامههای دسکتاپ Claude نیز در دسترس است. پیشتر فقط از طریق خط فرمان، افزونههای IDE، وب و چند مکان دیگر قابل دسترسی بود ولی در برنامه دسکتاپ نبود. رابط کاربری دسکتاپ Claude اکنون بین تجربه چت سنتی و تجربه Claude Code تببندی شده است.
و در نهایت (و برای برخی افراد از همه مهمتر)، تغییرات قیمتی بزرگی برای API Opus 4.5 اعمال شده است. هزینه آن اکنون 5 دلار (ورودی) / 25 دلار (خروجی) به ازای هر میلیون توکن است که نسبت به 15 دلار / 75 دلار قبلی کاهش یافته است.
این مطلب از منابع بینالمللی ترجمه و بازنویسی شده است.