Protein moleküllerinin hesaplamalı tasarımı ve yapısal tahminine yönelik çalışmalar bu yıl Nobel Kimya ödülüne layık görüldü. Londra merkezli yapay zeka (AI) firması Google DeepMind’dan Demis Hassabis ve John M. Jumper ödülü eşit olarak paylaşacak; Washington Üniversitesi’nden David Baker ise ödülün yarısını alacak.
Modern yapay zeka sistemlerinin kullandığı sinir ağlarının temelini atan araştırmacılara 2024 yılında verilecek fizik Nobel Ödülü’nün yanı sıra, kimya ödülü de bu algoritmaların çok sayıda alandaki devrimci etkisine ağırlık katıyor. Nobel Kimya Ödülü sahibi Kaliforniya Teknoloji Enstitüsü’nden Frances Arnold, çeşitli yeni rollere sahip sentetik enzimlerin geliştirilmesindeki çabaları nedeniyle bu ödülün “yapay zekanın bilimi nasıl güçlendirdiğinin bir göstergesi” olduğunu belirtti.
Bir proteinin yapısını yalnızca moleküler zincir diziliminden tahmin edebilen bir yöntem, büyük ölçüde Hassabis ve Jumper tarafından geliştirilen AlphaFold’dur. Ödül, Baker ve meslektaşları tarafından yeni, sentetik protein yapılarının tasarımı ve sentezi konusundaki çalışmaları nedeniyle paylaşıldı. AlphaFold bu konuda çok yardımcı oluyor çünkü katlanma dizisini belirli bir hedef yapıya doğru tahmin etmek için pratik olarak geriye doğru çalıştırılabiliyor.
Amino asit zincirleri olarak bilinen proteinlerin yapı taşları tipik olarak iyi tanımlanmış küre formlarına katlanır. Yapı dizilim tarafından belirlenir çünkü katlanma süreci çeşitli amino asitler arasındaki etkileşimler tarafından belirlenir. Örneğin bu asitlerden bazıları elektrik yükleri içerir. Birçok moleküler biyoloji sürecini anlamak ve bir proteinin aktivitesine bağlanabilen ve onu değiştirebilen terapötik bileşikleri keşfetmek, yapısını çıkarmaya bağlıdır, çünkü yapı da proteinin işlevini belirler.
Geçmişte proteinlerin yapılarını belirlemek için x-ışını kristalografisi ve elektron mikroskopisi gibi deneysel teknikler kullanılıyordu. Bununla birlikte, bilim insanları uzun zamandır protein katlanma sürecini anlamayı ve önceden tahmin etmeyi, yani bir yapıyı sadece diziliminden tahmin edebilmeyi arzulamaktadır.
Bu sorunun karmaşıklığı, moleküler dinamik simülasyonları gibi bilgisayar yaklaşımları için uzun zamandır bir zorluk olmuştur. Ancak AlphaFold herhangi bir katlama simülasyonu gerektirmiyordu. Alternatif olarak, algoritmaya bilinen yapılara sahip proteinlerdeki dizi-yapı korelasyonlarını tanımlaması ve daha sonra bu bilgiyi bilinmeyen yapılara sahip proteinlerin yapılarını tahmin etmek için kullanması öğretilebilir.
Algoritmanın 2018’de ilk kez ortaya çıkmasından dört yıl sonra, DeepMind’daki araştırmacılar, sistemde yapılan ilerlemeler sayesinde bakterilerden insanlara kadar yaşamın tüm alanlarında bilinen 200 milyon protein dizisinin tamamının yapılarını tahmin edebildi. Tahminlerin birçoğu kristalografi ile bulunan yapılara son derece benziyor, ancak bu tahminlerin kalitesi değişiyor (algoritma her birine bir güven puanı veriyor).
Daha genel bir soruna örnek olarak, karmaşık bir sistem en düşük enerjili, en kararlı durumunu nasıl keşfedebilir? İstatistiksel fizikçilerin uzun zamandır protein katlama problemiyle ilgilenmelerinin nedeni budur. Bir protein molekülünün amino asit zinciri boyunca sonsuz sayıda olası katlanma konfigürasyonu mevcuttur ve bu katlanma konfigürasyonlarının her birine bir enerji değeri verilebilir. Gizem, protein katlanmasının doğal sürecinin, çok sayıda yerel minimum olduğu için “yanlış” yapıda sıkışıp kalmadan bu “enerji manzarasını” küresel minimuma nasıl yönlendirdiğinde yatmaktadır. Manyetik malzemeler olan spin camları, karmaşık bir enerji ortamında küresel minimumun bulunması zorluğuyla karşı karşıya kalan birçok fiziksel sistemden sadece biridir.
Bazı akademisyenler, algoritma katlama zincirinin enerji ortamındaki yolunu belirleme zorluğundan kaçınsa da AlphaFold’un eğitim verilerinden ortamın bir temsilini veya “sezgisini” oluşturup oluşturmadığını merak ediyor.
Algoritma, belirli bir diziye en iyi nasıl uygulanacağını belirlemek için eğitim setinin koevrimsel verilerini (birkaç amino asit değişimi ile karşılaştırılabilir diziler için yapılar) kullanır. Enerji manzarasının uygun bölgesi, bu özdeş dizileri gözlemleyerek “hissedilebilir”.
Bu teoriyi test etmek için bilim insanları AlphaFold‘u, her bir amino asidin etkileşim enerjilerini hesaba katarak genel enerjiyi en aza indiren yapı tahmin yazılımı tarafından üretilen sentetik eş evrimsel verilerle eğitti. Bakış Açısı: Machine-Learning Model Reveals Protein-Folding Physics, programın altta yatan enerji manzarasını tespit edebileceği sonucuna nasıl vardıklarını açıklıyor.
Teksas’taki Rice Üniversitesi’nden teorik kimyager Peter Wolynes’e göre, AlphaFold’un birlikte evrimsel verilere bağımlılığı, algoritmanın mevcut sınırlarından biri olan tek bir yapı üzerinde aşırı güvenle ısrar etmesine neden oluyor. Proteinler biyolojik görevlerini yerine getirirken yapısal değişikliklere uğradıklarından, genellikle birden fazla kararlı şekle sahiptirler ve bu da algoritmanın hatalı çalışmasına neden olabilir. Yakın zamanda yapılan bir başka çalışmada, AlphaFold’un, bu yöntem başarılı olsa bile, kıvrım değiştiren proteinlerin morfolojilerini belirlemek için enerji manzarasının derin bir temsilini kullanmak yerine, eğitim verilerinden yapıları ezberlemeyi tercih ettiği bulunmuştur [3].
Bu uyarıların bir sonucu olarak, AlphaFold ve tüm yapay zeka araştırma araçlarına rehberlik etmek için insan uzmanlar gereklidir. Wolynes, insan muhakemesi ile birlikte düşünceli bir şekilde kullanıldığında bilimin makine öğreniminden büyük fayda sağlayabileceğini savunuyor.
Kaynak: physics.aps.org/articles/v17/149

