
Seiring dengan berkembangnya kemampuan model AI generatif, Anda mungkin pernah melihat bagaimana model tersebut dapat mengubah perintah teks sederhana menjadi gambar hiperrealistis dan bahkan klip video yang diperluas.
Baru-baru ini, AI generatif telah menunjukkan potensi dalam membantu ahli kimia dan biologi mengeksplorasi molekul statis, seperti protein dan DNA. Model seperti AlphaFold dapat memprediksi struktur molekul untuk mempercepat penemuan obat, dan “difusi RF,” misalnya, dapat membantu merancang protein baru. Namun, salah satu tantangannya adalah molekul terus bergerak dan berguncang, hal ini penting untuk dijadikan model ketika membangun protein dan obat baru. Mensimulasikan gerakan-gerakan ini di komputer menggunakan fisika – teknik yang dikenal sebagai dinamika molekuler – bisa sangat mahal dan memerlukan miliaran langkah waktu di superkomputer.
Sebagai langkah menuju simulasi perilaku ini dengan lebih efisien, Laboratorium Ilmu Komputer dan Kecerdasan Buatan (CSAIL) MIT dan peneliti Departemen Matematika telah mengembangkan model generatif yang belajar dari data sebelumnya. Sistem tim, yang disebut MDGen, dapat mengambil bingkai molekul 3D dan mensimulasikan apa yang akan terjadi selanjutnya seperti video, menghubungkan gambar diam yang terpisah, dan bahkan mengisi bingkai yang hilang. Dengan menekan “tombol putar” pada molekul, alat ini berpotensi membantu ahli kimia merancang molekul baru dan mempelajari dengan cermat seberapa baik prototipe obat mereka untuk kanker dan penyakit lain akan berinteraksi dengan struktur molekul yang ingin terkena dampaknya.
Rekan penulis utama Bowen Jing SM ’22 mengatakan bahwa MDGen adalah bukti awal konsep, namun hal ini menunjukkan awal dari arah penelitian baru yang menarik. “Pada awalnya, model AI generatif menghasilkan video yang agak sederhana, seperti orang berkedip atau anjing mengibaskan ekornya,” kata Jing, mahasiswa PhD di CSAIL. “Beberapa tahun ke depan, dan sekarang kami memiliki model luar biasa seperti Sora atau Veo yang dapat berguna dalam berbagai cara menarik. Kami berharap dapat menanamkan visi serupa untuk dunia molekuler, di mana lintasan dinamika adalah videonya. Misalnya, Anda dapat memberikan model frame pertama dan ke-10, dan model tersebut akan menganimasikan apa yang ada di antaranya, atau model tersebut dapat menghilangkan noise dari video molekuler dan menebak apa yang tersembunyi.”
Para peneliti mengatakan bahwa MDGen mewakili perubahan paradigma dari penelitian sebelumnya yang sebanding dengan AI generatif dengan cara yang memungkinkan kasus penggunaan yang lebih luas. Pendekatan sebelumnya bersifat “autoregresif”, artinya pendekatan ini mengandalkan bingkai diam sebelumnya untuk membuat bingkai berikutnya, mulai dari bingkai pertama untuk membuat rangkaian video. Sebaliknya, MDGen menghasilkan frame secara paralel dengan difusi. Ini berarti MDGen dapat digunakan untuk, misalnya, menghubungkan frame pada titik akhir, atau “meningkatkan sampel” lintasan kecepatan frame rendah selain menekan play pada frame awal.
Karya ini dipresentasikan dalam makalah yang ditampilkan pada Konferensi Sistem Pemrosesan Informasi Neural (NeurIPS) Desember lalu. Musim panas lalu, ia dianugerahi penghargaan atas potensi dampak komersialnya di Konferensi Internasional Lokakarya ML4LMS Pembelajaran Mesin.
Beberapa langkah kecil ke depan untuk dinamika molekuler
Dalam eksperimennya, Jing dan rekan-rekannya menemukan bahwa simulasi MDGen serupa dengan menjalankan simulasi fisik secara langsung, sekaligus menghasilkan lintasan 10 hingga 100 kali lebih cepat.
Tim pertama kali menguji kemampuan model mereka untuk mengambil bingkai 3D suatu molekul dan menghasilkan 100 nanodetik berikutnya. Sistem mereka menyatukan blok 10 nanodetik berturut-turut untuk generasi-generasi ini untuk mencapai durasi tersebut. Tim menemukan bahwa MDGen mampu bersaing dengan keakuratan model dasar, sekaligus menyelesaikan proses pembuatan video dalam waktu sekitar satu menit — hanya sepersekian dari tiga jam yang dibutuhkan model dasar untuk mensimulasikan dinamika yang sama.
Ketika diberikan frame pertama dan terakhir dari urutan satu nanodetik, MDGen juga memodelkan langkah-langkah di antaranya. Sistem para peneliti menunjukkan tingkat realisme dalam lebih dari 100.000 prediksi berbeda: Sistem ini mensimulasikan lintasan molekuler yang lebih mungkin dibandingkan garis dasarnya pada klip yang lebih pendek dari 100 nanodetik. Dalam pengujian ini, MDGen juga menunjukkan kemampuan untuk menggeneralisasi peptida yang belum pernah dilihat sebelumnya.
Kemampuan MDGen juga mencakup simulasi frame dalam frame, “upampling” langkah-langkah antara setiap nanodetik untuk menangkap fenomena molekuler yang lebih cepat dengan lebih memadai. Ia bahkan dapat “mengecat” struktur molekul, memulihkan informasi tentang molekul yang telah dihapus. Fitur-fitur ini pada akhirnya dapat digunakan oleh para peneliti untuk merancang protein berdasarkan spesifikasi bagaimana bagian-bagian molekul yang berbeda harus bergerak.
Bermain-main dengan dinamika protein
Jing dan rekan penulis utama Hannes Stärk mengatakan bahwa MDGen adalah tanda awal kemajuan dalam menghasilkan dinamika molekuler dengan lebih efisien. Namun, mereka kekurangan data untuk membuat model ini segera berdampak dalam merancang obat atau molekul yang menginduksi pergerakan yang ingin dilihat oleh para ahli kimia dalam struktur target.
Para peneliti bertujuan untuk mengukur MDGen mulai dari memodelkan molekul hingga memprediksi bagaimana protein akan berubah seiring waktu. “Saat ini, kami menggunakan sistem mainan,” kata Stärk, juga mahasiswa PhD di CSAIL. “Untuk meningkatkan kemampuan prediktif MDGen dalam memodelkan protein, kita perlu memanfaatkan arsitektur dan data yang tersedia saat ini. Kami belum memiliki tempat penyimpanan berskala YouTube untuk jenis simulasi tersebut, jadi kami berharap dapat mengembangkan metode pembelajaran mesin terpisah yang dapat mempercepat proses pengumpulan data untuk model kami.”
Untuk saat ini, MDGen memberikan jalan maju yang menggembirakan dalam memodelkan perubahan molekuler yang tidak terlihat dengan mata telanjang. Ahli kimia juga dapat menggunakan simulasi ini untuk mempelajari lebih dalam perilaku prototipe obat untuk penyakit seperti kanker atau tuberkulosis.
“Metode pembelajaran mesin yang belajar dari simulasi fisik mewakili batas baru yang sedang berkembang dalam AI untuk sains,” kata Bonnie Berger, Profesor Matematika MIT Simons, peneliti utama CSAIL, dan penulis senior makalah tersebut. “MDGen adalah kerangka pemodelan serbaguna dan multiguna yang menghubungkan kedua domain ini, dan kami sangat bersemangat untuk membagikan model awal kami ke arah ini.”
“Mengambil sampel jalur transisi yang realistis antara keadaan molekuler merupakan sebuah tantangan besar,” kata rekan penulis senior Tommi Jaakkola, yang merupakan Profesor Teknik Elektro dan Ilmu Komputer MIT Thomas Siebel dan Institut Data, Sistem, dan Masyarakat, serta peneliti utama CSAIL. . “Pekerjaan awal ini menunjukkan bagaimana kita dapat mulai mengatasi tantangan tersebut dengan mengalihkan pemodelan generatif ke simulasi penuh.”
Para peneliti di bidang bioinformatika telah memuji sistem ini karena kemampuannya untuk mensimulasikan transformasi molekul. “MDGen memodelkan simulasi dinamika molekuler sebagai distribusi gabungan dari struktur yang melekat, menangkap pergerakan molekul antara langkah-langkah waktu yang terpisah,” kata profesor asosiasi Chalmers University of Technology, Simon Olsson, yang tidak terlibat dalam penelitian ini. “Memanfaatkan tujuan pembelajaran yang terselubung, MDGen memungkinkan kasus penggunaan inovatif seperti pengambilan sampel jalur transisi, menggambar analogi untuk melukiskan lintasan yang menghubungkan fase metastabil.”
Pekerjaan para peneliti di MDGen didukung, sebagian, oleh Institut Nasional Ilmu Kedokteran Umum, Departemen Energi AS, National Science Foundation, Konsorsium Pembelajaran Mesin untuk Penemuan dan Sintesis Farmasi, Klinik Abdul Latif Jameel untuk Pembelajaran Mesin di bidang Kesehatan, Badan Pengurangan Ancaman Pertahanan, dan Badan Proyek Penelitian Lanjutan Pertahanan.
Informasi ini pertama kali tayang di MIT.edu klik disini untuk melihat berita lainnya.
Discover more from Kitiran Media
Subscribe to get the latest posts sent to your email.