OpenAI با انتشار GPT 5.2، مدلهای مرتبط از جمله Codex را نیز بهروزرسانی کرد. این مدلها اکنون قابلیتهای جدیدی در زمینه ساخت ربات (agentic) و امنیت سایبری ارائه میدهند.
GPT-5.2-Codex که OpenAI آن را «پیشرفتهترین مدل کدنویسی رباتیک برای مهندسی نرمافزار پیچیده و دنیای واقعی» مینامد، برای انجام کارهای طولانیمدت با رباتها بهینهسازی شده است و دارای قابلیتهای قویتر در زمینه امنیت سایبری خواهد بود. این بهروزرسانی، گامی مهم در نحوه پشتیبانی هوش مصنوعی پیشرفته از مهندسی نرمافزار واقعی و حوزههای تخصصی مانند امنیت سایبری محسوب میشود.
این مدل، مشتقشده از GPT-5.2 است که برای ساخت رباتها بهینه شده. کاربران میتوانند این مدل را در تمام سطوح Codex برای کاربران پولی ChatGPT دریافت کنند و OpenAI قصد دارد بهزودی دسترسی آن را از طریق API نیز فراهم کند. آنها همچنین در حال آزمایش یک برنامه با کاربران منتخب و مورد اعتماد هستند تا امکان دسترسی به مدلهای «مجوزدارتر» را برای متخصصان و سازمانهای دفاعی سایبری فراهم کنند.
OpenAI بر این باور است که GPT-5.2-Codex، قویترین مدل امنیتی سایبری آنها تاکنون است. با این حال، با افزایش قابلیتهای آن، طراحی یک رویکرد استقرار که حسابرسی رشد آینده و پشتیبانی از امنیت سایبری دفاعی را در نظر بگیرد ضروری است.
طبق گفته OpenAI ،با پیشرفت مدلها در خط مقدم هوش مصنوعی، این بهبودها همچنین به تواناییهای ویژه حوزههایی مانند امنیت سایبری ترجمه میشوند. آنها این مدل را روی سه معیار آزمایش کردند: ارزیابی بازی شکار پرچم (CTF)، CVE-Bench و Cyber Range.
نتایج بسیار چشمگیری در CTF evals ثبت شد که OpenAI آن را نتیجه «تراکم» یا توانایی مدل برای کارکرد منسجم در چندین پنجره زمینه میداند. این مدل با امتیاز ۸۷٪، از سایرین پیشی گرفت و GPT-5.1-Codex-Max رتبه دوم را به دست آورد. این بهبود میتواند در وظایفی مانند اجرای دستورات برای کشف آسیبپذیریها و آزمایش ابزارها بسیار کمککننده باشد.
در تست CVE-Bench، مدل امتیاز ۸۷٪ کسب کرد که از سایرین بالاتر بود. یک پژوهشگر امنیتی به نام اندرو مکفرسون با استفاده از GPT-5.1-Codex-Max، یک آسیبپذیری در کد منبع React را شناسایی و گزارش داد.
در تست Cyber Range با مدتزمان طولانیتر، مدل رتبه قبولی ۷۲.۷٪ کسب کرد که نسبت به امتیاز ۸۱.۸٪ GPT-5.1-Codex-Max اندکی کمتر بود.
OpenAI معتقد است که برای تعادل بین توسعه مدلهای پیشرو و ابزارهای لازم برای امنیت سایبری دفاعی، رویکرد استقرار باید با در نظر گرفتن این موضوع صورت گیرد. آنها قصد دارند یک برنامه دسترسی مورد اعتماد راهاندازی کنند تا امکان استفاده از قابلیتهای سایبری هوش مصنوعی پیشرو توسط مدافعان واجد شرایط فراهم شود.
بهرغم اینکه GPT-5.2-Codex در چارچوب آمادگی OpenAI سطح بالایی از تواناییهای سایبری را ندارد، شرکت قصد دارد کاربران منتخب را برای آزمایش قابلیتهای امنیتی دعوت کند و آنها را ارزیابی نماید. این اقدام به منظور تعیین تعادلی بین دسترسیپذیری و ایمنی انجام خواهد شد.
GPT-5.2 پیشتر مورد استقبال قرار گرفته بود بهخاطر استفاده از آن در وظایف تجاری و گردشکارهای کاری. با مدل Codex، برخی از این قابلیتها میتوانند منتقل شوند، به ویژه با توجه به برنامههای شرکتها برای استفاده از مدل جهت کدنویسی رباتهای خود.
شرکت اعلام کرده است که این مدل، عملکرد بهتری را در زمینه کارهای طولانیمدت و تغییرات گسترده کد ارائه میدهد. همچنین بهبود چشمگیری در کارایی آن روی سیستم عامل Windows مشاهده شده است.
بر اساس آزمایشهای انجامشده، GPT-5.2-Codex از نظر دقت عملکرد بهتری نسبت به نسخههای قبلی خود دارد و میتواند بهطور قابلاعتماد کارهای پیچیدهای مانند بازسازی کد در مقیاس بزرگ، مهاجرت کدها و ساخت ویژگیهای جدید را با تکرار مداوم بدون دستگمشدن انجام دهد.
از زمان عرضه نسخههای آزمایشی Codex در ماه می (اردیبهشت)، این پلتفرم نقش مهمی در پذیرش رباتیک و کدنویسی
📌 توجه: این مطلب از منابع بینالمللی ترجمه و بازنویسی شده است.