چگونه یادگیری ماشینی می تواند راه حل های چالش های طراحی پروتئین را تسریع کند -- ScienceDaily
انتشار: شهریور 24، 1401
بروزرسانی: 15 آذر 1404

چگونه یادگیری ماشینی می تواند راه حل های چالش های طراحی پروتئین را تسریع کند -- ScienceDaily

اخیراً الگوریتم های قدرتمند یادگیری ماشینی از جمله AlphaFold و RoseTTAFold برای پیش بینی اشکال دقیق پروتئین های طبیعی تنها بر اساس توالی های اسید آمینه آن ها آموزش دیده اند. یادگیری ماشینی نوعی هوش مصنوعی است که به رایانه ها اجازه می دهد بدون برنامه ریزی صریح از داده ها یاد بگیرند. یادگیری ماشینی می تواند برای مدل سازی مسائل علمی پیچیده که درک آن برای انسان بسیار دشوار است، استفاده شود.

طی دو سال گذشته، یادگیری ماشینی پیش بینی ساختار پروتئین را متحول کرده است. اکنون، سه مقاله وارد شده است علوم پایه انقلاب مشابهی را در طراحی پروتئین توصیف کنید.

بیکر افزود: «ProteinMPNN طراحی پروتئین همان چیزی است که AlphaFold برای پیش بینی ساختار پروتئین بود».

برای فراتر رفتن از پروتئین های موجود در طبیعت، اعضای تیم بیکر چالش طراحی پروتئین را به سه بخش تقسیم کردند و برای هر کدام از راه حل های نرم افزاری جدید استفاده کردند.

Basile Wicky، دانشمند پروژه، محقق فوق دکترا در موسسه طراحی پروتئین، گفت: "ما دریافتیم که پروتئین های ساخته شده با استفاده از ProteinMPNN بسیار بیشتر احتمال دارد که مطابق با هدف جمع شوند، و ما می توانیم مجموعه های پروتئینی بسیار پیچیده ای را با استفاده از این روش ها ایجاد کنیم."

شبکه های عصبی به راحتی آموزش داده می شوند، اما در مورد پروتئین ها، آن قدر که می خواهیم نمونه هایی نداریم. باید وارد می شدیم و مشخص می کردیم که کدام ویژگی ها در این مولکول ها مهم ترین هستند. جاستاس داپاراس، دانشمند پروژه، محقق فوق دکترا در موسسه طراحی پروتئین، گفت: کمی آزمون و خطا بود.

سوم، تیم از AlphaFold، ابزاری که توسط DeepMind Alphabet توسعه داده شده است، استفاده کرد تا به طور مستقل ارزیابی کند که آیا توالی های اسید آمینه ای که به دست آورده اند احتمالاً به شکل های مورد نظر تا می شوند یا خیر.

دوم، برای سرعت بخشیدن به این فرآیند، تیم یک الگوریتم جدید برای تولید توالی اسید آمینه ابداع کرد. شرح داده شده در شماره 15 سپتامبر علوم پایه، این ابزار نرم افزاری به نام ProteinMPNN در حدود یک ثانیه اجرا می شود. این بیش از 200 برابر سریعتر از بهترین نرم افزار قبلی است. نتایج آن نسبت به ابزارهای قبلی برتری دارد و نرم افزار برای اجرا نیازی به سفارشی سازی متخصص ندارد.

پروتئین ها اغلب به عنوان "بلوک های سازنده زندگی" شناخته می شوند زیرا برای ساختار و عملکرد همه موجودات زنده ضروری هستند. آنها تقریباً در هر فرآیندی که در داخل سلول اتفاق می افتد، از جمله رشد، تقسیم و ترمیم نقش دارند. پروتئین ها از زنجیره های بلندی از مواد شیمیایی به نام اسیدهای آمینه تشکیل شده اند. توالی اسیدهای آمینه در یک پروتئین شکل سه بعدی آن را تعیین می کند. این شکل پیچیده برای عملکرد پروتئین بسیار مهم است.

منابع کامپیوتری برای این کار توسط مایکروسافت و خدمات وب آمازون اهدا شد.

بودجه توسط پروژه جسورانه در موسسه طراحی پروتئین تامین شد. مایکروسافت؛ اریک و وندی اشمیت به توصیه شرکت های آتی اشمیت. پروژه کشف و طراحی هم افزایی دارپا (قرارداد HR001117S0003 FA8750-17-C-0219)؛ پروژه مهار فعالیت آنزیمی دارپا برای نجات جان (قرارداد HR001120S0052 HR0011-21-2-0012)؛ بنیاد تحقیقات واشنگتن؛ پروژه باز بشردوستانه بهبود صندوق طراحی پروتئین؛ Amgen; کمک مالی برنامه بنیاد آلفرد پی اسلون (G-2021-16899)؛ موقوفه دونالد و جو آن پترسن برای تسریع پیشرفت در تحقیقات بیماری آلزایمر. کمک هزینه تحصیلی بین رشته ای برنامه علوم مرزی انسانی (LT000395/2020-C)؛ سازمان زیست شناسی مولکولی اروپا (ALTF 139-2018)، از جمله بورسیه تحصیلی EMBO Non-Stipendiary (ALTF 1047-2019) و بورسیه بلند مدت EMBO (ALTF 191-2021). بنیاد "لا کایکسا"؛ موسسه پزشکی هوارد هیوز، از جمله کمک هزینه تحصیلی هانا گری (GT11817)؛ بنیاد ملی علوم (MCB 2032259، CHE-1629214، DBI 1937533، DGE-2140004)؛ مؤسسه ملی بهداشت (DP5OD026389)؛ موسسه ملی آلرژی و بیماری های عفونی (HHSN272201700059C)؛ موسسه ملی پیری (5U19AG065156)؛ موسسه ملی علوم پزشکی عمومی (P30 GM124169-01، P41 GM 103533-24)؛ موسسه ملی سرطان (R01CA240339)؛ بنیاد ملی علوم سوئیس؛ مرکز ملی صلاحیت مهندسی سیستم های مولکولی سوئیس. مرکز ملی صلاحیت در زیست شناسی شیمیایی سوئیس. و شورای تحقیقات اروپا (716058).



منبع

در مقاله های جدید، زیست شناسان دانشکده پزشکی دانشگاه واشنگتن نشان می دهند که یادگیری ماشینی می تواند برای ایجاد مولکول های پروتئین بسیار دقیق تر و سریع تر از آنچه قبلا ممکن بود استفاده شود. دانشمندان امیدوارند این پیشرفت به بسیاری از واکسن ها، درمان ها، ابزارهای جذب کربن و مواد زیستی پایدار منجر شود.

داپاراس توضیح داد: «نرم افزاری برای پیش بینی ساختارهای پروتئینی بخشی از راه حل است، اما نمی تواند به تنهایی چیز جدیدی ارائه دهد.

ابتدا باید یک شکل پروتئین جدید تولید شود. در مقاله ای که در 21 جولای در مجله منتشر شد علوم پایهاین تیم نشان داد که هوش مصنوعی می تواند اشکال پروتئینی جدیدی را به دو روش تولید کند. اولین مورد، که "توهم" نامیده می شود، شبیه به DALL-E یا سایر ابزارهای مولد هوش مصنوعی است که بر اساس اعلان های ساده خروجی تولید می کنند. دومی که "inpainting" نام دارد، مشابه ویژگی تکمیل خودکار موجود در نوارهای جستجوی مدرن است.

بیکر گفت: "این همان آغاز یادگیری ماشینی در طراحی پروتئین است. در ماه های آینده، ما برای بهبود این ابزارها برای ایجاد پروتئین های پویاتر و کاربردی تر کار خواهیم کرد."

در مقاله دیگری که در علوم پایه در 15 سپتامبر، تیمی از آزمایشگاه بیکر تأیید کردند که ترکیب ابزارهای یادگیری ماشینی جدید می تواند به طور قابل اعتمادی پروتئین های جدیدی تولید کند که در آزمایشگاه کار می کنند.

"پروتئین ها در سراسر زیست شناسی اساسی هستند، اما ما می دانیم که تمام پروتئین های موجود در هر گیاه، حیوان و میکروب بسیار کمتر از یک درصد از آنچه ممکن است را تشکیل می دهند. با این ابزارهای نرم افزاری جدید، محققان باید بتوانند راه حل هایی برای مدت طولانی پیدا کنند. دیوید بیکر، نویسنده ارشد، استاد بیوشیمی در دانشکده پزشکی دانشگاه واشنگتن و دریافت کننده جایزه پیشرفت در علوم زیستی در سال 2021، گفت: چالش های پایدار در پزشکی، انرژی و فناوری.

در میان پروتئین های جدید ساخته شده، حلقه هایی در مقیاس نانو وجود داشت که محققان معتقدند می توانند به قطعاتی برای نانوماشین های سفارشی تبدیل شوند. برای مشاهده این حلقه ها از میکروسکوپ های الکترونی استفاده شد که قطری تقریباً یک میلیارد برابر کوچک تر از یک دانه خشخاش دارند.