آلفافولد: انقلاب هوش مصنوعی در پیش‌بینی ساختار پروتئین‌ها و جایزه نوبل


در سال 2017، جان جامپر پس از اتمام دوره دکتری خود در رشته شیمی نظری، شایعه‌هایی را درباره‌ی تغییر تمرکز گوگل دیپ مایند به سمت پروژه‌ای محرمانه برای پیش‌بینی ساختار پروتئین‌ها شنید و برای شغل اقدام کرد. سه سال بعد، جامپر به‌همراه دمیز هاسیابیس، توسعه سیستم هوش مصنوعی آلفافولد 2 (AlphaFold 2) را جشن گرفتند؛ سیستمی که قادر به پیش‌بینی ساختارهای پروتئینی با دقت برابر آزمایشگاه‌ها و در عرض چند ساعت بود. این دستاورد چالش بزرگ ۵۰ ساله‌ زیست‌شناسی را حل کرد. هاسیابیس زمانی گفته بود: «این دلیل شروع دیپ مایند بود. در واقع، دلیل تمام تلاش‌های من در طول زندگی‌ام در زمینه هوش مصنوعی بوده است.» در سال 2024، جامپر و هاسیابیس جایزه نوبل شیمی را به خاطر این دستاورد ارزشمند دریافت کردند.

پانزدهمین سالگرد انتشار آلفافولد 2 فرا رسیده است. پس از گذر زمان و فروکش کردن هیجان اولیه، تأثیر واقعی آلفافولد چه بوده است؟ دانشمندان چگونه از آن استفاده می‌کنند؟ و آینده‌ی آن چیست؟ جان جامپر (و همچنین چند دانشمند دیگر) در این گفتگو به این سوالات پاسخ دادند.

«این پنج سال گذشته فوق‌العاده بوده‌اند»، جامپر می‌گوید، «یادآوری زمان قبل از آگاهی از تعداد زیادی خبرنگار دشوار است.»

پس از آلفافولد 2، آلفافولد مولتیمر (AlphaFold Multimer) برای پیش‌بینی ساختارهایی با بیش از یک پروتئین و سپس نسخه سریع‌تر آن معرفی شد. گوگل دیپ مایند همچنین به انتشار آلفافولد در پایگاه داده‌ی یونی‌پروت (UniProt)، یک دیتابیس عظیم پروتئینی که توسط میلیون‌ها پژوهشگر استفاده می‌شود، اقدام کرد. تا کنون، ساختار حدود 200 میلیون پروتئین را پیش‌بینی کرده است – تقریباً تمام پروتئین‌های شناخته شده در علم.

با وجود موفقیتش، جامپر در مورد دستاوردهای آلفافولد متواضع می‌ماند: «این بدان معنا نیست که ما از همه چیز مطمئن هستیم. این یک دیتابیس از پیش‌بینی‌هاست و با تمامی ملاحظات مربوط به پیش‌بینی همراه است.»

پروتئین‌ها ماشین‌های بیولوژیکی هستند که موجودات زنده را فعال می‌کنند. آن‌ها عضله، شاخ و پر ایجاد می‌کنند؛ اکسیژن را در سراسر بدن حمل کرده و پیام‌ها را بین سلول‌ها انتقال می‌دهند؛ نورون‌ها را فعال می‌کنند، غذا هضم می‌کنند، سیستم ایمنی را تقویت کرده و غیره. اما درک دقیقاً اینکه یک پروتئین چه کاری انجام می‌دهد (و چه نقشی ممکن است در بیماری‌های مختلف یا درمان‌ها ایفا کند) مستلزم تعیین ساختار آن است – که کار دشواری است.

پروتئین‌ها از رشته‌هایی از اسیدهای آمینه تشکیل شده‌اند که نیروهای شیمیایی آن‌ها را به گره‌های پیچیده می‌پیچند. یک رشته‌ی بدون خمیدگی، اطلاعات کمی در مورد ساختاری که ایجاد خواهد کرد، ارائه می‌دهد. به‌طور نظری، بیشتر پروتئین‌ها می‌توانند تعداد بی‌شماری از اشکال ممکن را اتخاذ کنند. وظیفه این است که شکل صحیح را پیش‌بینی کنید.

جامپر و تیمش آلفافولد 2 را با استفاده از نوعی شبکه‌ی عصبی به نام ترنسفورمر (Transformer) ساختند – همان فناوری که زیربنای مدل‌های زبان بزرگ را تشکیل می‌دهد. ترنسفورمرها در توجه به بخش‌های خاصی از یک پازل بزرگ بسیار خوب هستند.

با این حال، جامپر معتقد است که بخش بزرگی از موفقیت به دلیل ایجاد یک مدل اولیه بود که بتوانند آن را به‌سرعت آزمایش کنند: «ما سیستمی داشتیم که پاسخ‌های اشتباه را با سرعت باورنکردنی می‌داد. این باعث شد ایده‌هایی که امتحان می‌کنید بسیار جسورانه‌تر شوند.»

آن‌ها شبکه‌ی عصبی را با تمام اطلاعات مربوط به ساختارهای پروتئینی، مانند نحوه‌ی تکامل اشکال مشابه در سراسر گونه‌های مختلف، پر کردند و نتیجه حتی از آنچه انتظار داشتند بهتر بود. «ما مطمئن بودیم که یک پیشرفت اساسی ایجاد کرده‌ایم»، جامپر می‌گوید. «مطمئن بودیم که این یک پیشرفت شگفت‌انگیز در ایده‌ها است.»

یکی از پروژه‌های برجسته، گروهی تحقیقاتی است که از آلفافولد برای مطالعه مقاومت به بیماری در زنبورهای عسل استفاده می‌کند. «آن‌ها می‌خواستند این پروتئین خاص را بفهمند زیرا در مورد مسائلی مانند ریزش کلنی تحقیق می‌کنند. من هرگز نمی‌گفتم: ‘البته آلفافولد برای علم زنبور عسل کاربرد دارد.’»

او همچنین به چند نمونه از موارد استفاده‌ی غیرمنتظره آلفافولد اشاره می‌کند – «به معنای این نیست که تضمین شده است کار کند» – جایی که توانایی پیش‌بینی ساختار پروتئین تکنیک‌های تحقیقاتی جدیدی را باز کرده است. «پیشرفت‌های واضح در طراحی پروتئین اولین مورد است»، او می‌گوید. «دیوید بیکر و دیگران به‌طور کامل از این فناوری بهره برده‌اند.»

بیکر، زیست‌شناس محاسباتی در دانشگاه واشنگتن، یکی از برنده‌گان جایزه نوبل شیمی سال گذشته به‌همراه جامپر و هاسیابیس بود، به خاطر کارش بر روی ایجاد پروتئین‌های مصنوعی برای انجام وظایف خاص – مانند درمان بیماری یا تجزیه پلاستیک – بهتر از پروتئین‌های طبیعی. بیکر و همکارانش ابزاری مبتنی بر آلفافولد به نام RoseTTAFold را توسعه داده‌اند. اما آن‌ها همچنین با استفاده از AlphaFold Multimer آزمایش کرده‌اند تا پیش‌بینی کنند کدام یک از طرح‌های آن‌ها برای پروتئین‌های مصنوعی بالقوه کار خواهد کرد.

«به‌طور اساسی، اگر آلفافولد به‌طور قاطع با ساختاری که سعی دارید طراحی کنید موافق باشد، آن را بسازید و اگر آلفافولد بگوید ‘من نمی‌دانم’، آن را نسازید. این خود یک بهبود قابل توجه بود.» می‌تواند فرآیند طراحی را 10 برابر سریع‌تر کند، جامپر می‌گوید.

نمونه‌ی دیگر استفاده غیرمنتظره از آلفافولد، تبدیل کردن آن به نوعی موتور جستجو است. او به دو گروه تحقیقاتی اشاره می‌کند که سعی در درک دقیق نحوه‌ی اتصال اسپرم انسانی به تخمک داشتند. آن‌ها یکی از پروتئین‌های دخیل را می‌دانستند اما دیگری را نه: «و بنابراین آن‌ها یک پروتئین سطح تخم مرغ شناخته‌شده را گرفتند و 2000 پروتئین سطح اسپرم انسان را جستجو کردند، و یکی را پیدا کردند که آلفافولد به شدت مطمئن بود که به آن می‌چسبد.» سپس آن‌ها توانستند این موضوع را در آزمایشگاه تأیید کنند.


این مطلب از منابع بین‌المللی ترجمه و بازنویسی شده است.