Sistem baru memungkinkan robot untuk memecahkan masalah manipulasi dalam hitungan detik | Berita MIT

0 17 4 minutes read

[ad_1]

Siap untuk liburan musim panas yang sudah lama ditunggu-tunggu itu? Pertama, Anda harus mengemas semua item yang diperlukan untuk perjalanan Anda ke dalam koper, memastikan semuanya cocok dengan aman tanpa menghancurkan sesuatu yang rapuh.

Karena manusia memiliki keterampilan penalaran visual dan geometris yang kuat, ini biasanya merupakan masalah langsung, bahkan jika mungkin perlu sedikit finagling untuk memeras semuanya.

Namun, bagi robot, ini adalah tantangan perencanaan yang sangat kompleks yang membutuhkan pemikiran secara bersamaan tentang banyak tindakan, kendala, dan kemampuan mekanis. Menemukan solusi yang efektif dapat memakan robot yang sangat lama – jika bahkan dapat muncul dengan satu.

Para peneliti dari MIT dan NVIDIA Research telah mengembangkan algoritma baru yang secara dramatis mempercepat proses perencanaan robot. Pendekatan mereka memungkinkan robot untuk “berpikir ke depan” dengan mengevaluasi ribuan solusi yang mungkin secara paralel dan kemudian menyempurnakan yang terbaik untuk memenuhi kendala robot dan lingkungannya.

Alih -alih menguji setiap tindakan potensial satu per satu, seperti banyak pendekatan yang ada, metode baru ini mempertimbangkan ribuan tindakan secara bersamaan, menyelesaikan masalah manipulasi multistep dalam hitungan detik.

Para peneliti memanfaatkan kekuatan komputasi besar -besaran dari prosesor khusus yang disebut Graphics Processing Unit (GPU) untuk memungkinkan speedup ini.

Di sebuah pabrik atau gudang, teknik mereka dapat memungkinkan robot untuk dengan cepat menentukan cara memanipulasi dan mengemas barang -barang yang memiliki bentuk dan ukuran yang berbeda tanpa merusaknya, mengetuk apa pun, atau bertabrakan dengan hambatan, bahkan di ruang yang sempit.

“Ini akan sangat membantu dalam pengaturan industri di mana waktu benar -benar penting dan Anda perlu menemukan solusi yang efektif secepat mungkin. Jika algoritma Anda membutuhkan waktu beberapa menit untuk menemukan rencana, sebagai lawan detik, itu membutuhkan biaya bisnis,” kata mahasiswa pascasarjana MIT William Shen Sm ’23, utama penulis tersebut kertas tentang teknik ini.

Dia bergabung di atas kertas oleh Caelan Garrett ’15, Meng ’15, PhD ’21, seorang ilmuwan peneliti senior di Nvidia Research; Nishanth Kumar, seorang mahasiswa pascasarjana MIT; Ankit Goyal, seorang ilmuwan riset Nvidia; Tucker Hermans, seorang ilmuwan riset dan profesor rekan NVIDIA di University of Utah; Leslie Pack Kaelbling, Profesor Ilmu Komputer dan Teknik Panasonic di MIT dan anggota Laboratorium Ilmu Komputer dan Kecerdasan Buatan (CSAIL); Tomás Lozano-Pérez, seorang profesor MIT dari Ilmu dan Teknik Komputer dan anggota CSAIL; dan Fabio Ramos, ilmuwan riset utama di Nvidia dan seorang profesor di University of Sydney. Penelitian ini akan dipresentasikan di Konferensi Robotika: Sains dan Sistem.

Perencanaan secara paralel

Algoritma para peneliti dirancang untuk apa yang disebut tugas dan perencanaan gerak (TAMP). Tujuan dari algoritma TAMP adalah untuk membuat rencana tugas untuk robot, yang merupakan urutan tindakan tingkat tinggi, bersama dengan rencana gerak, yang mencakup parameter aksi tingkat rendah, seperti posisi bersama dan orientasi gripper, yang melengkapi rencana tingkat tinggi itu.

Untuk membuat rencana untuk mengemas item dalam sebuah kotak, robot perlu beralasan tentang banyak variabel, seperti orientasi akhir dari benda yang dikemas sehingga mereka cocok bersama, serta bagaimana ia akan mengambilnya dan memanipulasi mereka menggunakan lengan dan grippernya.

Ini harus melakukan ini sambil menentukan cara menghindari tabrakan dan mencapai kendala yang ditentukan pengguna, seperti urutan tertentu untuk mengemas item.

Dengan begitu banyak urutan tindakan potensial, pengambilan sampel solusi yang mungkin secara acak dan mencoba satu per satu bisa memakan waktu yang sangat lama.

“Ini adalah ruang pencarian yang sangat besar, dan banyak tindakan yang dilakukan robot di ruang itu tidak benar -benar mencapai sesuatu yang produktif,” tambah Garrett.

Sebaliknya, algoritma para peneliti, yang disebut Cutamp, yang dipercepat menggunakan platform komputasi paralel yang disebut CUDA, mensimulasikan dan memurnikan ribuan solusi secara paralel. Ini melakukan ini dengan menggabungkan dua teknik, pengambilan sampel dan optimasi.

Pengambilan sampel melibatkan memilih solusi untuk dicoba. Tetapi alih -alih solusi pengambilan sampel secara acak, Cutamp membatasi kisaran solusi potensial untuk mereka yang paling mungkin memenuhi kendala masalah. Prosedur pengambilan sampel yang dimodifikasi ini memungkinkan Cutamp untuk secara luas mengeksplorasi solusi potensial sambil mempersempit ruang pengambilan sampel.

“Setelah kami menggabungkan output dari sampel ini, kami mendapatkan titik awal yang jauh lebih baik daripada jika kami mencicipi secara acak. Ini memastikan kami dapat menemukan solusi lebih cepat selama optimasi,” kata Shen.

Setelah Cutamp telah menghasilkan set sampel itu, ia melakukan prosedur optimisasi paralelisasi yang menghitung biaya, yang sesuai dengan seberapa baik setiap sampel menghindari tabrakan dan memenuhi batasan gerak robot, serta tujuan yang ditentukan pengguna.

Ini memperbarui sampel secara paralel, memilih kandidat terbaik, dan mengulangi prosesnya sampai mempersempitnya menjadi solusi yang sukses.

Memanfaatkan komputasi yang dipercepat

Para peneliti memanfaatkan GPU, prosesor khusus yang jauh lebih kuat untuk perhitungan paralel dan beban kerja daripada CPU tujuan umum, untuk meningkatkan jumlah solusi yang dapat mereka sampel dan mengoptimalkan secara bersamaan. Ini memaksimalkan kinerja algoritma mereka.

“Menggunakan GPU, biaya komputasi untuk mengoptimalkan satu solusi sama dengan mengoptimalkan ratusan atau ribuan solusi,” Shen menjelaskan.

Ketika mereka menguji pendekatan mereka tentang tantangan pengemasan seperti Tetris dalam simulasi, Cutamp hanya membutuhkan waktu beberapa detik untuk menemukan rencana yang sukses dan bebas dari tabrakan yang mungkin mengambil pendekatan perencanaan berurutan lebih lama untuk dipecahkan.

Dan ketika digunakan pada lengan robot yang nyata, algoritma selalu menemukan solusi dalam waktu kurang dari 30 detik.

Sistem ini bekerja di seluruh robot dan telah diuji pada lengan robot di MIT dan robot humanoid di NVIDIA. Karena Cutamp bukanlah algoritma pembelajaran mesin, tidak memerlukan data pelatihan, yang memungkinkannya untuk siap digunakan dalam banyak situasi.

“Anda bisa memberikannya masalah baru dan terbukti menyelesaikannya,” kata Garrett.

Algoritma ini dapat digeneralisasikan ke situasi di luar pengemasan, seperti robot yang menggunakan alat. Seorang pengguna dapat memasukkan berbagai jenis keterampilan ke dalam sistem untuk memperluas kemampuan robot secara otomatis.

Di masa depan, para peneliti ingin Memanfaatkan model bahasa besar dan model bahasa visi Di dalam Cutamp, memungkinkan robot untuk merumuskan dan melaksanakan rencana yang mencapai tujuan spesifik berdasarkan perintah suara dari pengguna.

Pekerjaan ini didukung, sebagian, oleh National Science Foundation (NSF), Kantor Angkatan Udara untuk Penelitian Ilmiah, Kantor Penelitian Angkatan Laut, MIT Quest for Intelligence, NVIDIA, dan Institut Robotika dan Intelijen Buatan.

[ad_2]

Informasi ini pertama kali tayang di MIT.edu klik disini untuk melihat berita lainnya.

Discover more from Kitiran Media

Subscribe to get the latest posts sent to your email.

Sistem baru memungkinkan robot untuk memecahkan masalah manipulasi dalam hitungan detik | Berita MIT

Like this:

Discover more from Kitiran Media

Leave a Reply Cancel reply

Share this:

Like this:

Discover more from Kitiran Media

Related Articles

CNBC mencoba tes pendengaran, pelindung pendengaran, alat bantu dengar

Untuk menjaga hardware aman, hentikan petunjuk kode | Berita MIT

CEO SAP mendesak Eropa untuk tidak mengatur AI, katanya akan membuat kawasan tertinggal

Saham Adobe anjlok 14% karena panduan pendapatan tahun 2025 yang mengecewakan

Leave a Reply Cancel reply