در روز دوشنبه، آنتراپیک نسخه جدید مدل پرچمدان خود، آپوس 4.5 را اعلام کرد. این آخرین نسخه از سری 4.5 مدلهای آنتراپیک است که پس از انتشار سونِت 4.5 در سپتامبر و هایکو 4.5 در اکتبر، به بازار عرضه شد.
همانطور که انتظار میرفت، آپوس 4.5 عملکردی پیشرفتهای در طیف وسیعی از معیارها، از جمله معیارهای کدنویسی (SWE-Bench و Terminal-bench)، استفاده از ابزارها (tau2-bench و MCP Atlas) و حل مسئله عمومی (ARC-AGI 2, GPQA Diamond) دارد.
به طور خاص، آپوس 4.5 اولین مدلی است که نمره بالای 80% را در SWE-Bench Verified، یک معیار کدنویسی معتبر، کسب کرده است.
آنتراپیک همچنین بر قابلیتهای استفاده از کامپیوتر و صفحه گستردهی آپوس تاکید کرد و چندین محصول موازی را برای نمایش عملکرد این مدل در آن زمینهها راه اندازی کرد. همراه با آپوس 4.5، آنتراپیک محصولات خود – که پیشتر در مرحله آزمایشی بودند – را به صورت گستردهتری در دسترس قرار میدهد. افزونهی کروم برای تمام کاربران Max و مدل متمرکز بر اکسل برای کاربران Max، Team و Enterprise در دسترس خواهد بود.
آپوس 4.5 همچنین با بهبود حافظه برای عملیات با زمینه طولانی همراه است که نیازمند تغییرات قابل توجهی در نحوه مدیریت حافظه توسط مدل بود.
«بهبودهایی را در کیفیت کلی زمینه طولانی در آموزش با آپوس 4.5 ایجاد کردیم، اما پنجرههای زمینه به تنهایی کافی نخواهند بود.» دیان نا پن، مدیر محصول تحقیقاتی آنتراپیک به TechCrunch گفت: «دانستن جزئیات مناسب برای به خاطر سپردن واقعاً مهم است و این در تکمیل داشتن یک پنجرهی زمینه طولانیتر اهمیت دارد.»
این تغییرات همچنین امکان فعالسازی ویژگی
این مطلب از منابع بینالمللی ترجمه و بازنویسی شده است.