Kamis 22 Jun 2023 07:16 WIB

Meta Luncurkan Voicebox AI, Ini Fungsinya

Voicebox cukup kuat untuk menghasilkan suara semudah ChatGPT.

Rep: Meiliza Laveda/ Red: Natalia Endah Hapsari
 Meta mengumumkan kehadiran Voicebox, generator kecerdasan buatan (AI) yang diklaim mengungguli semua model yang ada./ilustrasi
Foto: EPA-EFE/META HANDOUT
Meta mengumumkan kehadiran Voicebox, generator kecerdasan buatan (AI) yang diklaim mengungguli semua model yang ada./ilustrasi

REPUBLIKA.CO.ID, JAKARTA---Meta mengumumkan kehadiran Voicebox, generator kecerdasan buatan (AI) yang diklaim mengungguli semua model yang ada. Voicebox cukup kuat untuk menghasilkan suara semudah ChatGPT yang dapat menghasilkan teks dan Bing atau Dall-E 2 yang dapat membuat gambar.

Meskipun sistem belum tersedia secara luas untuk penggunaan publik, Meta telah membuat demo agar bisa diakses oleh siapa pun yang tertarik untuk mempelajari lebih lanjut tentang Voicebox. Sistem ini dapat digunakan dalam pengeditan audio oleh pembuat konten dan editor karena pembuatan suaranya menghasilkan klip audio yang terdengar alami.

Baca Juga

Salah satu kemampuan Voicebox adalah mencocokkan gaya audio sampel dan menghasilkan klip teks-ke-ucapan. Pada dasarnya, pengguna tunanetra dapat memberikan Voicebox klip audio dari seorang teman sesingkat dua detik dan Voicebox dapat membaca pesan tertulis teman tersebut dalam suara mereka menggunakan AI.

Alat AI generatif baru ini dapat menyelesaikan tugas melalui pembelajaran dalam konteks sehingga dapat memproses teks yang belum pernah diberikan sebelumnya dan menghasilkan konteks serta infleksi dengan benar. Siapa pun dapat membuat klip audio menggunakan rekaman suara seseorang tanpa izin dan mengklaim mereka mengatakan apa pun yang mereka inginkan.

Dilansir ZDNET, dalam makalah yang diterbitkan, Meta mengklaim model klasifikasi biner dapat membedakan antara ucapan dunia nyata dan yang dihasilkan oleh Voicebox. Meta melatih Voicebox dengan 60 ribu jam buku audio bahasa Inggris dan 50 ribu jam buku audio multibahasa dalam enam bahasa untuk performa optimal.

Perusahaan mengklaim dapat menghasilkan sampel audio yang beragam 20 kali lebih cepat daripada VALL-E Microsoft dan lebih dapat dipahami. Selain lebih cepat dan membuat kesalahan lebih sedikit daripada pesaing, Meta mengklaim Voicebox dapat mengubah teks tertulis menjadi kata-kata lisan dalam satu atau beberapa bahasa tanpa dilatih secara khusus untuk setiap bahasa secara terpisah.

Dibandingkan dengan model canggih sebelumnya, YourTTS, Voicebox terbukti mengurangi rata-rata tingkat kesalahan kata dari 10,9 persen menjadi 5,2 persen serta meningkatkan kesamaan audio dari 0,335 menjadi 0,481. 

 

Advertisement
Berita Lainnya
Advertisement
Advertisement
Advertisement