Home Berita Dalam Negeri Penyakit menghilangkan suaranya. AI membuat replika yang dia bawa di ponselnya

Penyakit menghilangkan suaranya. AI membuat replika yang dia bawa di ponselnya

November 27, 2024

Tautan Jejak Breadcrumb

Bisnis PMN

Pers Terkait

Matt O’brien

Diterbitkan 13 Mei 2024 • 7 menit dibaca

Konten artikel

PROVIDENCE, RI (AP) — Suara Alexis “Lexi” Bogan sebelum musim panas lalu terdengar penuh semangat.

Dia suka menyanyikan lagu balada Taylor Swift dan Zach Bryan di dalam mobil. Dia tertawa sepanjang waktu – bahkan ketika mengoreksi anak-anak prasekolah yang berperilaku buruk atau berdebat politik dengan teman-temannya di depan perapian di halaman belakang. Di sekolah menengah, dia adalah seorang soprano di bagian refrain.

Konten artikel

Lalu suara itu hilang.

Dokter pada bulan Agustus mengangkat tumor yang mengancam jiwa yang terletak di dekat bagian belakang otaknya. Ketika selang pernapasannya dilepas sebulan kemudian, Bogan mengalami kesulitan menelan dan berusaha untuk mengucapkan “hai” kepada orang tuanya. Rehabilitasi selama berbulan-bulan membantu kesembuhannya, namun kemampuan bicaranya masih terganggu. Teman, orang asing, dan anggota keluarganya sendiri kesulitan memahami apa yang ingin dia sampaikan kepada mereka.

Iklan 2

Konten artikel

Pada bulan April, pemain berusia 21 tahun ini mendapatkan kembali suaranya yang dulu. Bukan yang asli, tapi tiruan suara yang dihasilkan oleh kecerdasan buatan yang bisa dia panggil dari aplikasi telepon. Dilatih dengan kapsul waktu 15 detik dari suara remajanya — bersumber dari video demonstrasi memasak yang dia rekam untuk proyek sekolah menengah — suara AI-nya yang sintetis namun terdengar sangat nyata kini dapat mengatakan hampir semua hal yang dia inginkan.

Dia mengetik beberapa kata atau kalimat ke ponselnya dan aplikasi langsung membacanya dengan lantang.

“Hai, bolehkah saya memesan espreso kocok susu oat gula merah grande,” kata suara AI Bogan sambil mengulurkan telepon ke luar jendela mobilnya di drive-thru Starbucks.

Para ahli telah memperingatkan bahwa teknologi kloning suara AI yang berkembang pesat dapat memperbesar penipuan telepon, mengganggu pemilihan umum yang demokratis, dan melanggar martabat orang-orang – baik yang masih hidup maupun yang sudah meninggal – yang tidak pernah setuju suaranya dibuat ulang untuk mengatakan hal-hal yang tidak pernah mereka ucapkan.

Ini telah digunakan untuk menghasilkan robocall palsu kepada pemilih di New Hampshire yang meniru Presiden Joe Biden. Di Maryland, pihak berwenang baru-baru ini menuduh seorang direktur atletik sekolah menengah atas menggunakan AI untuk membuat klip audio palsu yang menampilkan kepala sekolah mengeluarkan pernyataan rasis.

Konten artikel

Iklan 3

Konten artikel

Namun Bogan dan tim dokter di kelompok rumah sakit Lifespan di Rhode Island yakin mereka telah menemukan kegunaan yang dapat membenarkan risiko tersebut. Bogan adalah salah satu orang pertama — satu-satunya dengan kondisi seperti itu _ yang mampu menciptakan kembali suara yang hilang dengan Mesin Suara OpenAI yang baru. Beberapa penyedia AI lainnya, seperti startup ElevenLabs, telah menguji teknologi serupa untuk orang-orang yang mengalami gangguan bicara dan kehilangan kemampuan bicara – termasuk seorang pengacara yang kini menggunakan klon suaranya di ruang sidang.

“Kami berharap Lexi menjadi pelopor seiring berkembangnya teknologi,” kata Dr. Rohaid Ali, seorang residen bedah saraf di sekolah kedokteran Brown University dan Rumah Sakit Rhode Island. Jutaan orang dengan penyakit stroke, kanker tenggorokan, atau penyakit neurogeneratif yang melemahkan dapat memperoleh manfaat dari program ini, katanya.

“Kita harus sadar akan risikonya, tapi kita tidak boleh melupakan pasien dan kebaikan sosialnya,” kata Dr. Fatima Mirza, warga lain yang mengerjakan proyek percontohan ini. “Kami dapat membantu Lexi mengembalikan suara aslinya dan dia dapat berbicara dalam istilah yang paling sesuai dengan dirinya.”

Mirza dan Ali, yang sudah menikah, menarik perhatian OpenAI pembuat ChatGPT karena proyek penelitian mereka sebelumnya di Lifespan menggunakan chatbot AI untuk menyederhanakan formulir persetujuan medis bagi pasien. Perusahaan asal San Francisco ini berupaya mencari aplikasi medis yang menjanjikan untuk generator suara AI barunya pada awal tahun ini.

Iklan 4

Konten artikel

Bogan masih perlahan pulih dari operasi. Penyakit ini dimulai musim panas lalu dengan sakit kepala, penglihatan kabur dan wajah murung, sehingga membuat dokter di Rumah Sakit Anak Hasbro di Providence khawatir. Mereka menemukan tumor pembuluh darah sebesar bola golf yang menekan batang otaknya dan terjerat di pembuluh darah dan saraf kranial.

“Ini adalah perjuangan untuk mengendalikan pendarahan dan mengeluarkan tumornya,” kata ahli bedah saraf anak Dr. Konstantina Svokos.

Operasi yang memakan waktu 10 jam ditambah dengan lokasi dan tingkat keparahan tumor merusak otot lidah dan pita suara Bogan, sehingga menghambat kemampuannya untuk makan dan berbicara, kata Svokos.

“Sepertinya sebagian identitas saya diambil ketika saya kehilangan suara,” kata Bogan.

Tabung pengisi keluar tahun ini. Terapi wicara terus berlanjut, memungkinkannya berbicara dengan jelas di ruangan yang sunyi namun tanpa ada tanda-tanda bahwa dia akan memulihkan kejernihan suara alaminya sepenuhnya.

“Pada titik tertentu, saya mulai lupa seperti apa suara saya,” kata Bogan. “Aku sudah terbiasa dengan suaraku sekarang.”

Setiap kali telepon berdering di rumah keluarganya di pinggiran Providence, North Smithfield, dia akan menyerahkan telepon itu kepada ibunya untuk menerima teleponnya. Dia merasa membebani teman-temannya setiap kali mereka pergi ke restoran yang bising. Ayahnya, yang mengalami gangguan pendengaran, kesulitan memahaminya.

Iklan 5

Konten artikel

Kembali ke rumah sakit, dokter sedang mencari pasien percontohan untuk bereksperimen dengan teknologi OpenAI.

“Orang pertama yang terlintas di benak Dr. Svokos adalah Lexi,” kata Ali. “Kami menghubungi Lexi untuk mengetahui apakah dia tertarik, tanpa mengetahui apa tanggapannya. Dia ingin mencobanya dan melihat cara kerjanya.”

Bogan harus kembali beberapa tahun ke belakang untuk menemukan rekaman suaranya yang cocok untuk “melatih” sistem AI tentang cara dia berbicara. Itu adalah video di mana dia menjelaskan cara membuat salad pasta.

Dokternya sengaja memberi sistem AI hanya klip berdurasi 15 detik. Suara memasak membuat bagian lain video menjadi tidak sempurna. Itu juga yang dibutuhkan OpenAI — sebuah peningkatan dibandingkan teknologi sebelumnya yang memerlukan sampel lebih panjang.

Mereka juga tahu bahwa mendapatkan sesuatu yang berguna dalam waktu 15 detik bisa menjadi hal yang penting bagi pasien masa depan yang tidak memiliki jejak suaranya di internet. Pesan suara singkat yang ditujukan kepada kerabat mungkin sudah cukup.

Saat mereka mengujinya untuk pertama kali, semua orang tercengang dengan kualitas klon suaranya. Gangguan yang sesekali terjadi – kata yang salah diucapkan, intonasi yang hilang – sebagian besar tidak terlihat. Pada bulan April, dokter membekali Bogan dengan aplikasi telepon khusus yang hanya dapat digunakan oleh dia.

Iklan 6

Konten artikel

“Saya menjadi sangat emosional setiap kali saya mendengar suaranya,” kata ibunya, Pamela Bogan, sambil berlinang air mata.

“Saya pikir sungguh luar biasa bahwa saya dapat memiliki suara itu lagi,” tambah Lexi Bogan, dan mengatakan bahwa hal itu membantu “meningkatkan kepercayaan diri saya ke tingkat sebelum semua ini terjadi.”

Dia sekarang menggunakan aplikasi tersebut sekitar 40 kali sehari dan mengirimkan masukan yang dia harap dapat membantu pasien di masa depan. Salah satu eksperimen pertamanya adalah berbicara dengan anak-anak di prasekolah tempat dia bekerja sebagai asisten pengajar. Dia mengetik “ha ha ha ha” mengharapkan respons robot. Yang mengejutkannya, itu terdengar seperti tawa lamanya.

Dia menggunakannya di Target dan Marshall untuk menanyakan di mana menemukan barang. Ini membantunya berhubungan kembali dengan ayahnya. Dan itu membuatnya lebih mudah untuk memesan makanan cepat saji.

Para dokter di Bogan telah mulai mengkloning suara pasien Rhode Island lainnya dan berharap dapat membawa teknologi ini ke rumah sakit di seluruh dunia. OpenAI mengatakan pihaknya berhati-hati dalam memperluas penggunaan Voice Engine, yang belum tersedia untuk umum.

Sejumlah startup AI kecil sudah menjual layanan kloning suara ke studio hiburan atau menyediakannya lebih luas. Sebagian besar vendor pembuat suara menyatakan bahwa mereka melarang peniruan identitas atau penyalahgunaan, namun cara mereka menegakkan ketentuan penggunaannya berbeda-beda.

Iklan 7

Konten artikel

“Kami ingin memastikan bahwa setiap orang yang suaranya digunakan dalam layanan ini memberikan persetujuan secara berkelanjutan,” kata Jeff Harris, pimpinan produk OpenAI. “Kami ingin memastikan bahwa ini tidak digunakan dalam konteks politik. Jadi kami mengambil pendekatan yang sangat terbatas dalam memberikan teknologi kepada siapa.”

Harris mengatakan langkah OpenAI selanjutnya melibatkan pengembangan alat “otentikasi suara” yang aman sehingga pengguna hanya dapat mereplikasi suara mereka sendiri. Hal ini mungkin “membatasi pasien seperti Lexi, yang tiba-tiba kehilangan kemampuan berbicaranya,” katanya. “Jadi kami berpikir bahwa kita perlu memiliki hubungan saling percaya yang tinggi, terutama dengan penyedia layanan kesehatan, untuk memberikan akses yang lebih bebas terhadap teknologi.”

Bogan telah membuat para dokternya terkesan dengan fokusnya dalam memikirkan bagaimana teknologi dapat membantu orang lain yang memiliki hambatan bicara serupa atau lebih parah.

“Bagian dari apa yang telah dia lakukan selama proses ini adalah memikirkan cara untuk mengubah dan mengubah hal ini,” kata Mirza. “Dia telah menjadi inspirasi besar bagi kami.”

Saat ini dia harus mengutak-atik ponselnya agar mesin suara dapat berbicara, Bogan membayangkan mesin suara AI yang menyempurnakan solusi lama untuk pemulihan ucapan — seperti elektrolaring yang terdengar seperti robot atau prostesis suara — yang menyatu dengan tubuh manusia. atau menerjemahkan kata secara real time.

Dia kurang yakin tentang apa yang akan terjadi seiring bertambahnya usia dan suara AI-nya terus terdengar seperti saat remaja. Mungkin teknologi ini bisa “menua” suara AI-nya, katanya.

Untuk saat ini, “meskipun suara saya belum pulih sepenuhnya, saya memiliki sesuatu yang membantu saya menemukan suara saya kembali,” katanya.

___

Associated Press dan OpenAI memiliki perjanjian lisensi dan teknologi yang memungkinkan OpenAI mengakses bagian dari arsip teks AP.

Konten artikel

Bagikan artikel ini di jejaring sosial Anda

Penyakit menghilangkan suaranya. AI membuat replika yang dia bawa di ponselnya

REKOMENDASI

CNRL membatasi produksi sumur gas alam baru karena harga yang masih rendah

Kapan The Fed akan menurunkan suku bunganya? Ketika perekonomian AS mulai membaik, mungkin...

The Largest Global Mission to Discover Ocean Life Reveals Over 800 Newly Discovered Marine...

Tahun Kerjanya : 2024