شرکت Anthropic اعلام کرده که به راهحلی برای مشکل طولانیمدت حافظه در سیستمهای عامل هوش مصنوعی دست یافته است. این شرکت با معرفی یک SDK جدید چند جلسهای برای Claude، رویکردی دوگانه را ارائه میدهد تا امکان کارکرد عوامل (Agents) را در چندین پنجرهی زمینه (Context Window) فراهم کند.
یکی از چالشهای اصلی در سیستمهای عامل هوش مصنوعی طولانیمدت، نیاز به کارکرد آنها در جلسات مجزا است. هر جلسه با حافظهای خالی آغاز میشود و این مسئله بهویژه زمانی مشکلساز میشود که پنجرههای زمینه محدود هستند و پروژههای پیچیده نمیتوانند در یک جلسه کامل شوند. Anthropic معتقد است راهحل آنها با پل زدن شکاف بین این جلسات، به عوامل اجازه میدهد تا وظایف خود را به طور مداوم انجام دهند.
راهحل پیشنهادی Anthropic شامل دو بخش اصلی است: یک عامل آغازگر (Initializer Agent) برای تنظیم محیط و یک عامل کدنویسی (Coding Agent) که بهصورت تدریجی پیشرفت میکند و در هر جلسه، مصنوعات (Artifacts) را برای جلسه بعدی باقی میگذارد. این رویکرد به مدلها کمک میکند تا با وجود محدودیتهای پنجرهی زمینه، از دست دادن دستورالعملها و عملکرد غیرعادی جلوگیری کنند.
Anthropic اذعان دارد که حتی قابلیتهای مدیریت زمینه Claude Agent SDK کافی نیستند. آنها در وبلاگ خود توضیح دادند که یک مدل در حال استفاده از Claude Agent SDK ممکن است اگر فقط با یک اعلان سطح بالا مانند «ساختن کلون claude.ai» شروع به کار کند، نتواند یک برنامه وب با کیفیت تولیدی بسازد. این شکستها معمولاً در دو الگو رخ میدهند: اول، عامل سعی میکند بیش از حد انجام دهد و باعث میشود مدل وسط کار از کمبود زمینه خارج شود؛ دوم، پس از ساخت برخی ویژگیها، عامل بهطور ناگهانی اعلام میکند که کار تمام شده است.
راهحل Anthropic بر پایه دو اصل کلیدی بنا شده است: تنظیم یک محیط اولیه برای ایجاد پایهای برای ویژگیها و هدایت هر عامل به سمت پیشرفت تدریجی در راستای هدف نهایی، در حالی که در پایان هر جلسه، صفحهی خالی را حفظ میکند. این رویکرد از شیوههایی الهام گرفته شده که مهندسان نرمافزار حرفهای روزانه از آنها استفاده میکنند.
علاوه بر این، Anthropic ابزارهای تست را به عامل کدنویسی اضافه کرده است تا توانایی آن در شناسایی و رفع اشکالات غیر واضح از طریق کد افزایش یابد. شرکت تاکید میکند که رویکرد آنها تنها یکی از راه حلهای ممکن برای ایجاد یک سیستم عامل هوش مصنوعی طولانیمدت است، اما گام اولی در این زمینه محسوب میشود.
Anthropic در آزمایشهای خود هنوز مشخص نکرده است که آیا یک عامل کدنویسی عمومی بهترین عملکرد را در تمام زمینهها دارد یا یک ساختار چندعاملی مناسبتر است. همچنین، دمو آنها بر توسعه برنامههای وب full-stack متمرکز بوده و آزمایشهای بیشتری برای تعمیم نتایج به وظایف دیگر مورد نیاز است.
Anthropic معتقد است که این درسها میتوانند در انواع وظایف عاملانه طولانیمدت مانند تحقیقات علمی یا مدلسازی مالی نیز کاربرد داشته باشند.
منبع: Anthropic says it solved the long-running AI agent problem with a new multi-session Claude SDK
این مطلب از منابع بینالمللی ترجمه و بازنویسی شده است.