آنتراپیک مدل Opus 4.5 را با قیمت ارزان‌تر، قدرت بیشتر و بهره‌وری بالاتر معرفی کرد


آنتراپیک (Anthropic) مدل جدید خود به نام Opus 4.5 را با بهبودهای قابل توجهی در قدرت، بهره‌وری و قیمت معرفی کرده است. این مدل با هدف رفع انتقاداتی که به طولانی شدن گفتگوها در مدل‌های قبلی Claude وارد می‌شد، طراحی شده و عملکرد کدنویسی آن نیز ارتقا یافته است. علاوه بر این، بهبودهایی در تجربه کاربری نیز اعمال شده تا Opus 4.5 رقابت‌پسندتری نسبت به آخرین مدل‌های پیشرو OpenAI باشد.

یکی از مهم‌ترین تغییرات برای اکثر کاربران، کاهش احتمال پایان ناگهانی گفتگوها در برنامه‌های کاربردی (وب، موبایل و دسکتاپ) است. این بهبود در حافظه یکباره در گفتگوها فقط به Opus 4.5 بلکه به تمام مدل‌های Claude فعلی در برنامه‌ها اعمال می‌شود.

کاربرانی که قبلاً با پایان ناگهانی گفتگوها مواجه شده بودند (حتی زمانی که فضای کافی در جلسه و بودجه استفاده هفتگی آن‌ها باقی مانده بود)، به دلیل رسیدن به محدودیت پنجره زمینه (200,000 توکن) با این مشکل روبرو می‌شدند. برخلاف برخی از پیاده‌سازی‌های مدل‌های زبانی بزرگ که در صورت عبور از حداکثر ظرفیت، شروع به حذف پیام‌های قبلی از زمینه می‌کنند، Claude گفتگو را به طور کامل قطع می‌کرد تا کاربر تجربه‌ای از یک گفتگوی ناسازگار و فراموشکار نداشته باشد.

اکنون، Claude به‌طور خودکار اقدام به خلاصه‌سازی نکات کلیدی از قسمت‌های اولیه گفتگو می‌کند و تلاش می‌کند اطلاعات غیرضروری را حذف کرده و موارد مهم را حفظ کند. توسعه‌دهندگانی که از API آنتراپیک استفاده می‌کنند نیز می‌توانند با مدیریت زمینه و فشرده‌سازی زمینه، از این اصول بهره ببرند.

**عملکرد برجسته Opus 4.5:**
Opus 4.5 اولین مدلی است که به امتیاز دقت بالای 80 درصد (به طور دقیق‌تر 80.9 درصد) در معیار SWE-Bench Verified دست یافته و از GPT-5.1-Codex-Max (77.9 درصد) و Gemini 3 Pro (76.2 درصد) شرکت‌های OpenAI و Google پیشی گرفته است. این مدل به‌ویژه در بنچمارک‌های کدنویسی و استفاده ابزاری عملکرد خوبی دارد، اما هنوز از GPT-5.1 در استدلال بصری (MMMU) عقب‌تر است.

آنتراپیک همچنین ادعا می‌کند که Opus 4.5 نسبت به مدل‌های Claude قبلی یا مدل‌های رقیبی مانند GPT-5.1 و Gemini 3 Pro، کمتر در برابر حملات تزریق پرامپت (prompt injection attacks) آسیب‌پذیر است. با این حال، هیچ‌کدام از این مدل‌ها عملکرد کاملاً بی‌نقصی در این زمینه ندارند.

در حالی که بهبودهای عملکرد در بنچمارک‌ها قابل توجه هستند، به احتمال زیاد مهم‌ترین پیشرفت Opus 4.5، کارایی بیشتر آن با توکن‌ها است. آنتراپیک گزارش می‌دهد:

* با تنظیم سطح تلاش متوسط، Opus 4.5 به امتیاز مشابه Sonnet 4.5 در SWE-bench Verified می‌رسد اما از 76% توکن‌های خروجی کمتری استفاده می‌کند.
* در بالاترین سطح تلاش، Opus 4.5 عملکرد Sonnet 4.5 را تا 4.3 درصد افزایش می‌دهد – در حالی که از 48% توکن‌های کمتری استفاده می‌کند.

عرضه Opus 4.5 همراه با ویژگی‌های جدیدی برای توسعه‌دهندگان و کاربران نیز هست. به عنوان مثال، پلتفرم توسعه‌دهنده اکنون شامل یک پارامتر جدید به نام «تلاش» (effort) است که به توسعه‌دهندگان اجازه می‌دهد تعادل مورد نظر خود را بین اثربخشی و استفاده از توکن‌ها تنظیم کنند.

همچنین، Claude Code اکنون در برنامه‌های دسکتاپ Claude نیز در دسترس است. پیش‌تر فقط از طریق خط فرمان، افزونه‌های IDE، وب و چند مکان دیگر قابل دسترسی بود ولی در برنامه دسکتاپ نبود. رابط کاربری دسکتاپ Claude اکنون بین تجربه چت سنتی و تجربه Claude Code تب‌بندی شده است.

و در نهایت (و برای برخی افراد از همه مهم‌تر)، تغییرات قیمتی بزرگی برای API Opus 4.5 اعمال شده است. هزینه آن اکنون 5 دلار (ورودی) / 25 دلار (خروجی) به ازای هر میلیون توکن است که نسبت به 15 دلار / 75 دلار قبلی کاهش یافته است.


این مطلب از منابع بین‌المللی ترجمه و بازنویسی شده است.