Claude Opus 4.5: هوش مصنوعی ارزان‌تر و قدرتمندتر از OpenAI

Anthropic مدل جدید هوش مصنوعی خود، Claude Opus 4.5 را عرضه کرد که با کاهش چشمگیر قیمت‌ها و ادعای عملکرد بی‌نظیر در مهندسی نرم‌افزار، رقابت فزاینده‌ای با OpenAI و Google آغاز کرده است. این مدل در ارزیابی‌های داخلی Anthropic از تمامی کاندیداهای انسانی برای شغل مهندسی پیشی گرفته است که نشان‌دهنده پیشرفت سریع سیستم‌های هوش مصنوعی و سوالات پیرامون تأثیر آن‌ها بر مشاغل یقه‌ای سفید است.

Anthropic قیمت Claude Opus 4.5 را در حدود ۵ دلار به ازای هر میلیون توکن ورودی و ۲۵ دلار به ازای هر میلیون توکن خروجی تعیین کرده است – کاهش قابل توجهی نسبت به نرخ‌های قبلی خود. این اقدام، دسترسی به قابلیت‌های هوش مصنوعی پیشرفته را برای طیف وسیع‌تری از توسعه‌دهندگان و شرکت‌ها فراهم می‌کند و در عین حال فشار بر رقبا برای تطبیق با عملکرد و قیمت را افزایش می‌دهد.

الکس آلبرت، مدیر روابط توسعه‌دهندگان Anthropic، در مصاحبه‌ای گفت: «ما می‌خواهیم اطمینان حاصل کنیم که این مدل واقعاً برای افرادی که می‌خواهند با آن کار کنند مفید باشد. تمرکز اصلی ما این است که چگونه Claude را بهتر در کمک به شما در انجام کارهایی که نمی‌خواهید در شغل خود انجام دهید، یاری دهیم؟»

Claude Opus 4.5 بر اساس تست‌های داخلی Anthropic، جهش کیفی در توانایی‌های استدلال مدل را نشان داده است. این مدل با کسب ۸۰.۹٪ دقت در یک معیار ارزیابی وظایف مهندسی نرم‌افزار دنیای واقعی، از GPT-5.1-Codex-Max (۷۷.۹٪)، Sonnet 4.5 (۷۷.۲٪) و Gemini 3 Pro (۷۶.۲٪) پیشی گرفته است. این نتیجه نشان‌دهنده یک گام قابل توجه نسبت به مدل‌های فعلی OpenAI است.

کاربران گزارش می‌دهند که Claude Opus 4.5 قضاوت و شهود بهتری در انجام وظایف مختلف دارد، به‌طوری که حس می‌کند درک بهتری از موضوعات دنیای واقعی پیدا کرده است. آلبرت معتقد است با این مدل، می‌توان وظایف کامل‌تری را واگذار کرد و آن را به Slack و اسناد داخلی متصل نمود تا خلاصه‌های منسجم مطابق با اولویت‌های کاربر ارائه دهد.

نتایج ارزیابی در آزمون مهندسی داخلی Anthropic نشان می‌دهد که Claude Opus 4.5 از تمامی کاندیداهای انسانی در این آزمون سخت‌گیرانه پیشی گرفته است. این آزمون، توانایی فنی و قضاوت را تحت فشار زمانی دو ساعته ارزیابی می‌کند. با استفاده از تکنیکی به نام محاسبات موازی در زمان تست، مدل Claude Opus 4.5 بالاترین نمره را کسب کرد. اگرچه این آزمایش مهارت‌های ضروری حرفه‌ای مانند همکاری و ارتباطات را اندازه‌گیری نمی‌کند، اما Anthropic معتقد است که این نتیجه سوالاتی را درباره نحوه تغییر هوش مصنوعی شغل مهندسی مطرح می‌کند.

Anthropic با ارائه پارامتر

منبع: Anthropic’s Claude Opus 4.5 is here: Cheaper AI, infinite chats, and coding skills that beat humans

این مطلب از منابع بین‌المللی ترجمه و بازنویسی شده است.