Model komputasi baru dapat memprediksi struktur antibodi dengan lebih akurat | Berita MIT
![](http://kitiranmedia.com/wp-content/uploads/2025/01/MIT-Antibodies-AI-01_0-780x470.jpg)
Dengan mengadaptasi model kecerdasan buatan yang dikenal sebagai model bahasa besar, para peneliti telah mencapai kemajuan besar dalam kemampuan mereka memprediksi struktur protein dari urutannya. Namun, pendekatan ini belum berhasil untuk antibodi, sebagian karena hipervariabilitas yang terlihat pada jenis protein ini.
Untuk mengatasi keterbatasan tersebut, peneliti MIT telah mengembangkan teknik komputasi yang memungkinkan model bahasa besar memprediksi struktur antibodi dengan lebih akurat. Pekerjaan mereka memungkinkan para peneliti menyaring jutaan kemungkinan antibodi untuk mengidentifikasi antibodi yang dapat digunakan untuk mengobati SARS-CoV-2 dan penyakit menular lainnya.
“Metode kami memungkinkan kami melakukan penskalaan, sedangkan metode lain tidak, hingga pada titik di mana kami benar-benar dapat menemukan beberapa jarum di tumpukan jerami,” kata Bonnie Berger, Profesor Matematika Simons, kepala kelompok Komputasi dan Biologi di Komputer MIT Laboratorium Sains dan Kecerdasan Buatan (CSAIL), dan salah satu penulis senior studi baru ini. “Jika kita dapat membantu menghentikan perusahaan obat melakukan uji klinis dengan produk yang salah, hal ini akan menghemat banyak uang.”
Teknik ini, yang berfokus pada pemodelan wilayah antibodi yang hipervariabel, juga memiliki potensi untuk menganalisis seluruh repertoar antibodi dari individu. Hal ini berguna untuk mempelajari respons imun orang-orang yang sangat tanggap terhadap penyakit seperti HIV, untuk membantu mengetahui mengapa antibodi mereka menangkis virus dengan sangat efektif.
Bryan Bryson, seorang profesor teknik biologi di MIT dan anggota Ragon Institute of MGH, MIT, dan Harvard, juga merupakan penulis senior makalah ini, yang muncul minggu ini di Prosiding Akademi Ilmu Pengetahuan Nasional. Rohit Singh, mantan ilmuwan peneliti CSAIL yang sekarang menjadi asisten profesor biostatistik dan bioinformatika dan biologi sel di Duke University, dan Chiho Im ’22 adalah penulis utama makalah ini. Peneliti dari Sanofi dan ETH Zurich juga berkontribusi dalam penelitian ini.
Memodelkan hipervariabilitas
Protein terdiri dari rantai panjang asam amino, yang dapat dilipat menjadi sejumlah besar kemungkinan struktur. Dalam beberapa tahun terakhir, memprediksi struktur ini menjadi lebih mudah dilakukan dengan menggunakan program kecerdasan buatan seperti AlphaFold. Banyak dari program ini, seperti ESMFold dan OmegaFold, didasarkan pada model bahasa besar, yang awalnya dikembangkan untuk menganalisis teks dalam jumlah besar, memungkinkan mereka belajar memprediksi kata berikutnya secara berurutan. Pendekatan yang sama juga dapat diterapkan pada rangkaian protein – dengan mempelajari struktur protein mana yang paling mungkin terbentuk dari pola asam amino yang berbeda.
Namun, teknik ini tidak selalu berhasil pada antibodi, terutama pada segmen antibodi yang dikenal sebagai wilayah hipervariabel. Antibodi biasanya memiliki struktur berbentuk Y, dan daerah hipervariabel ini terletak di ujung Y, tempat antibodi tersebut mendeteksi dan mengikat protein asing, yang juga dikenal sebagai antigen. Bagian bawah Y memberikan dukungan struktural dan membantu antibodi berinteraksi dengan sel kekebalan.
Daerah hipervariabel panjangnya bervariasi tetapi biasanya mengandung kurang dari 40 asam amino. Diperkirakan bahwa sistem kekebalan tubuh manusia dapat menghasilkan hingga 1 triliun antibodi berbeda dengan mengubah urutan asam amino ini, membantu memastikan bahwa tubuh dapat merespons berbagai macam antigen potensial. Urutan tersebut tidak dibatasi secara evolusioner dengan cara yang sama seperti urutan protein lainnya, sehingga sulit bagi model bahasa besar untuk belajar memprediksi strukturnya secara akurat.
“Salah satu alasan mengapa model bahasa dapat memprediksi struktur protein dengan baik adalah karena evolusi membatasi rangkaian ini sedemikian rupa sehingga model dapat menguraikan apa arti dari batasan tersebut,” kata Singh. “Ini mirip dengan mempelajari aturan tata bahasa dengan melihat konteks kata dalam sebuah kalimat, sehingga Anda dapat mengetahui artinya.”
Untuk memodelkan wilayah hipervariabel tersebut, para peneliti membuat dua modul yang dibangun berdasarkan model bahasa protein yang sudah ada. Salah satu modul ini dilatih tentang rangkaian hipervariabel dari sekitar 3.000 struktur antibodi yang ditemukan di Bank Data Protein (PDB), sehingga memungkinkannya mempelajari rangkaian mana yang cenderung menghasilkan struktur serupa. Modul lainnya dilatih berdasarkan data yang mengkorelasikan sekitar 3.700 rangkaian antibodi dengan seberapa kuat mereka mengikat tiga antigen berbeda.
Model komputasi yang dihasilkan, yang dikenal sebagai AbMap, dapat memprediksi struktur antibodi dan kekuatan pengikatan berdasarkan urutan asam aminonya. Untuk menunjukkan kegunaan model ini, para peneliti menggunakannya untuk memprediksi struktur antibodi yang akan menetralkan protein lonjakan virus SARS-CoV-2 dengan kuat.
Para peneliti memulai dengan serangkaian antibodi yang diperkirakan mengikat target tersebut, kemudian menghasilkan jutaan varian dengan mengubah wilayah hipervariabel. Model mereka mampu mengidentifikasi struktur antibodi yang paling berhasil, jauh lebih akurat dibandingkan model struktur protein tradisional yang didasarkan pada model bahasa besar.
Kemudian, para peneliti mengambil langkah tambahan dengan mengelompokkan antibodi ke dalam kelompok yang memiliki struktur serupa. Mereka memilih antibodi dari masing-masing kelompok tersebut untuk diuji secara eksperimental, bekerja sama dengan para peneliti di Sanofi. Eksperimen tersebut menemukan bahwa 82 persen antibodi ini memiliki kekuatan pengikatan yang lebih baik dibandingkan antibodi asli yang dimasukkan ke dalam model.
Mengidentifikasi berbagai kandidat yang baik di awal proses pengembangan dapat membantu perusahaan obat menghindari menghabiskan banyak uang untuk menguji kandidat yang akhirnya gagal di kemudian hari, kata para peneliti.
“Mereka tidak ingin menaruh semua telurnya dalam satu keranjang,” kata Singh. “Mereka tidak mau mengatakan, saya akan mengambil antibodi yang satu ini dan menjalani uji praklinis, dan kemudian ternyata menjadi racun. Mereka lebih suka memiliki serangkaian kemungkinan yang baik dan melewati semuanya, sehingga mereka memiliki beberapa pilihan jika ada yang salah.”
Membandingkan antibodi
Dengan menggunakan teknik ini, para peneliti juga dapat mencoba menjawab beberapa pertanyaan lama tentang mengapa orang-orang merespons infeksi secara berbeda. Misalnya, mengapa beberapa orang mengembangkan bentuk Covid yang jauh lebih parah, dan mengapa beberapa orang yang terpajan HIV tidak pernah tertular?
Para ilmuwan telah mencoba menjawab pertanyaan-pertanyaan tersebut dengan melakukan pengurutan RNA sel tunggal dari sel-sel kekebalan dari individu dan membandingkannya – sebuah proses yang dikenal sebagai analisis repertoar antibodi. Penelitian sebelumnya menunjukkan bahwa repertoar antibodi dari dua orang berbeda mungkin tumpang tindih sebanyak 10 persen. Namun, pengurutan tidak memberikan gambaran komprehensif tentang kinerja antibodi seperti informasi struktural, karena dua antibodi yang memiliki urutan berbeda mungkin memiliki struktur dan fungsi yang serupa.
Model baru ini dapat membantu memecahkan masalah tersebut dengan secara cepat menghasilkan struktur untuk semua antibodi yang ditemukan pada seseorang. Dalam studi ini, para peneliti menunjukkan bahwa ketika struktur diperhitungkan, terdapat lebih banyak tumpang tindih antar individu dibandingkan 10 persen yang terlihat dalam perbandingan urutan. Mereka sekarang berencana untuk menyelidiki lebih lanjut bagaimana struktur ini dapat berkontribusi terhadap respon imun tubuh secara keseluruhan terhadap patogen tertentu.
“Di sinilah model bahasa sangat cocok karena memiliki skalabilitas analisis berbasis urutan, namun mendekati keakuratan analisis berbasis struktur,” kata Singh.
Penelitian ini didanai oleh Sanofi dan Klinik Abdul Latif Jameel untuk Pembelajaran Mesin di Kesehatan.
Informasi ini pertama kali tayang di MIT.edu klik disini untuk melihat berita lainnya.
Discover more from Kitiran Media
Subscribe to get the latest posts sent to your email.