‘Sebuah perusahaan teknologi mencuri suara kami – lalu mengkloning dan menjualnya’
‘Sebuah perusahaan teknologi mencuri suara kami – lalu mengkloning dan menjualnya’
Gagasan bahwa kecerdasan buatan suatu hari nanti dapat mengambil alih pekerjaan kita adalah pesan yang telah didengar banyak dari kita dalam beberapa tahun terakhir.
Namun, bagi Paul Skye Lehrman, peringatan itu sangat pribadi, mengerikan, dan tidak terduga: dia mendengar suaranya sendiri menyampaikannya.
Pada bulan Juni 2023, Paul dan rekannya Linnea Sage sedang berkendara di dekat rumah mereka di New York City, mendengarkan podcast tentang pemogokan yang sedang berlangsung di Hollywood dan bagaimana kecerdasan buatan (AI) dapat memengaruhi industri tersebut.
Episode ini menarik karena pasangan tersebut adalah pengisi suara dan – seperti banyak kreator lainnya – khawatir bahwa generator suara yang terdengar seperti manusia akan segera digunakan untuk menggantikan mereka.
Podcast khusus ini memiliki daya tarik yang unik – mereka mewawancarai bot obrolan bertenaga AI, yang dilengkapi dengan perangkat lunak text-to-speech, untuk menanyakan bagaimana menurutnya penggunaan AI akan memengaruhi pekerjaan di Hollywood.
Namun, saat berbicara, suaranya seperti Tuan Lehrman.
“Kami harus menepikan mobil itu,” katanya.
“Ironisnya, AI akan hadir di industri hiburan, dan ini suara saya yang berbicara tentang potensi kehancuran industri ini, sungguh sangat mengejutkan.”
Malam itu mereka menghabiskan waktu berjam-jam di internet, mencari petunjuk hingga mereka menemukan situs platform text-to-speech Lovo. Sesampainya di sana, Sage mengatakan ia juga menemukan salinan suaranya.
“Saya tercengang,” katanya. “Saya tidak dapat mempercayainya.”
“Sebuah perusahaan teknologi mencuri suara kita, membuat tiruan AI dari suara kita, dan menjualnya mungkin ratusan ribu kali.”
Mereka kini telah mengajukan gugatan terhadap Lovo. Perusahaan tersebut belum menanggapi gugatan tersebut atau permintaan BBC untuk memberikan komentar.
Perang klon
Namun, bagaimana Lovo bisa meniru suara mereka? Pasangan itu menuduh hal itu dilakukan dengan alasan palsu.
Salah seorang pendiri Lovo, Tom Lee, sebelumnya mengatakan perangkat lunak kloning suaranya hanya mengharuskan pengguna membaca sekitar 50 kalimat untuk membuat klon yang setia.
“Kami dapat menangkap nada, karakter, gaya, fonem, dan bahkan jika Anda memiliki aksen, kami juga dapat menangkapnya,” ungkapnya kepada podcast Future Visionaries pada tahun 2021.
Dalam gugatan mereka, pasangan itu memaparkan bagaimana mereka mengatakan Lovo memperoleh rekaman seperti itu dari mereka.
Mereka menuduh karyawan Lovo anonim menghubungi mereka untuk merekam aset audio di Fiverr, situs web bakat lepas populer, tempat mereka menjual layanan mereka untuk menyediakan audio untuk televisi, radio, permainan video, dan media lainnya.
Pertama, pada tahun 2019, Ibu Sage mengatakan seorang pengguna menghubunginya dan meminta dia untuk merekam lusinan skrip radio uji yang kedengarannya generik.
Rekaman uji coba sering digunakan dalam film dan televisi untuk kelompok fokus, rapat internal, atau sebagai penanda untuk karya yang sedang dalam proses. Karena tidak akan dibagikan secara luas, rekaman ini jauh lebih murah daripada audio yang dimaksudkan untuk siaran.
Ibu Sage mengatakan dia menyelesaikan pekerjaannya, mengirimkan berkasnya, dan dibayar $400 (£303).
Sekitar enam bulan kemudian, Tn. Lehrman mengatakan dia mendapat permintaan serupa untuk merekam lusinan iklan radio yang terdengar generik.
Dalam pesan yang dibagikan pasangan itu kepada BBC, pengguna Fiverr anonim mengatakan audio tersebut akan digunakan untuk penelitian tentang “sintesis ucapan”.
Setelah meminta pengguna untuk menjamin bahwa skrip tersebut tidak akan digunakan di luar proyek penelitian spesifik mereka, Tn. Lehrman bertanya apa tujuan proyek tersebut.
“Skrip tersebut tidak akan digunakan untuk hal lain,” kata pengguna, “dan saya belum bisa memberi tahu Anda tujuannya, karena ini merupakan pekerjaan rahasia yang masih dalam proses, maaf haha”.
Tn. Lehrman menanyakan apakah berkas yang sudah selesai akan digunakan kembali atau digunakan dalam urutan yang berbeda. Pengguna mengatakan berkas tersebut akan digunakan untuk keperluan penelitian saja. Tn. Lehrman mengatakan ia mengirimkan berkas tersebut dan dibayar $1200.
Mereka mengatakan, hubungan antara pengguna anonim dan Lovo datang dari Lovo sendiri.
Mereka membagi bukti yang mereka temukan tentang kloningan suara mereka dengan Lovo – yang menjawab bahwa mereka tidak melakukan kesalahan apa pun, dan menunjuk komunikasi di antara mereka dengan pengguna anonim tersebut sebagai bukti bahwa mereka terlibat dengan pasangan itu secara sah.
“Dalam karier kami, kami telah mengirimkan lebih dari 100.000 aset audio,” kata Tn. Lehrman, tentang pekerjaan mereka di Fiverr selama hampir satu dekade.
“Kami dapat menemukan jarum ini di tumpukan jerami – mereka memberi kami jarum ini di tumpukan jerami.”
Dalam kedua kasus tersebut, baik Tn. Lehrman maupun Ny. Sage mengatakan bahwa mereka tidak memiliki kontrak tertulis, hanya percakapan tersebut. BBC belum dapat memverifikasi keseluruhan percakapan mereka. Pasangan tersebut mengatakan bahwa pengguna yang mereka ajak bicara juga tampaknya telah menghapus beberapa pesan.
BBC menghubungi Lovo beberapa kali untuk meminta wawancara dengan Tn. Lee dan meminta tanggapan atas klaim pasangan tersebut. Mereka tidak menanggapi satu pun pesan kami.
Apa kata hukum?
Gugatan hukum yang diajukan pasangan itu pada bulan Mei menuduh bahwa Lovo menggunakan rekaman suara mereka untuk membuat salinan yang secara ilegal bersaing dengan suara asli Sage dan Tn. Lehrman.
Pasangan itu mengatakan perusahaan tersebut melakukannya tanpa izin atau kompensasi yang layak.
Ini adalah gugatan class action – yang berarti mereka berharap penggugat lain akan bergabung, meskipun sejauh ini belum ada yang melakukannya.
Profesor Kristelia Garcia, pakar hukum kekayaan intelektual di Universitas Georgetown di Washington DC mengatakan kasus tersebut kemungkinan berpusat pada bidang hukum AS yang disebut hak publisitas.
Kadang-kadang disebut sebagai hak kepribadian, pelanggaran terhadap publisitas seseorang sering kali berasal dari penyalahgunaan atau kesalahan penggambaran gambar atau suara seseorang.
Dia juga mengatakan kemungkinan ada pelanggaran kontrak mengenai lisensi yang diberikan oleh Ibu Sage dan Bapak Lehrman kepada pengguna yang memesan rekaman tersebut.
“Lisensi adalah izin untuk penggunaan yang sangat spesifik dan terbatas. Saya mungkin memberi Anda izin untuk menggunakan kolam renang saya suatu sore, tetapi itu tidak berarti Anda dapat datang kapan pun Anda mau dan berpesta di kolam renang saya,” katanya kepada BBC.
“Itu akan melampaui ketentuan lisensi.”
Apa pun hasil kasusnya, ini adalah kasus lain dalam daftar panjang tuntutan hukum yang diajukan oleh para seniman, penulis, ilustrator, dan musisi yang tidak ingin kehilangan kendali atas karya dan mata pencaharian mereka.
Dan kemungkinan besar hal ini hanya merupakan puncak dari gunung es. Minggu ini, perusahaan keuangan Klarna mengatakan bahwa berencana menggunakan AI untuk mengurangi separuh tenaga kerjanya.
Beberapa ahli memperkirakan 40% dari semua pekerjaan pada akhirnya akan terpengaruh oleh AI
Namun, bagi Tn. Lehrman dan Nn. Sage, masa depan yang mengkhawatirkan itu mulai terjadi sekarang.
“Seluruh pengalaman ini terasa begitu tidak nyata,” kata Ibu Sage.
“Saat kita memikirkan kecerdasan buatan, yang terbayang di benak kita adalah AI yang melipat cucian dan membuatkan kita makan malam, bukan yang mengejar usaha kreatif manusia.”
Anda dapat mendengar lebih lanjut tentang cerita ini di Kehidupan Teknologidi BBC Sounds.
Source link