REPUBLIKA.CO.ID, JAKARTA---Meta merilis kode kecerdasan buatan (AI) sumber terbuka baru yang disebut AudioCraft, yang memungkinkan pengguna membuat musik dan suara sepenuhnya melalui AI generatif. Apakah ini mampu menggantikan penyintesis alias perangkat kibor yang memproduksi suara dalam bentuk sinyal/gelombang suara yang mengirimkannya kepada pembangkit suara?
Terdapat tiga model AI, semuanya menangani berbagai bidang pembuatan suara. MusicGen mengambil input teks untuk menghasilkan musik. Model ini dilatih tentang 20.000 jam musik yang dimiliki oleh Meta atau dilisensikan secara khusus untuk tujuan ini.
AudioGen membuat audio dari petunjuk tertulis, mensimulasikan gonggongan anjing atau langkah kaki, dan dilatih tentang efek suara publik. Versi dekoder EnCodec Meta yang ditingkatkan memungkinkan pengguna membuat suara dengan lebih sedikit artefak yang terjadi jika terlalu banyak memanipulasi audio.
Ada beberapa sampel audio yang dibuat dengan AudioCraft. Suara siulan, sirene, dan senandung yang dihasilkan terdengar cukup alami. Meskipun senar gitar pada lagu-lagu itu terasa nyata, namun tetap terasa buatan.
Meta menjadi perusahaan yang terbaru untuk menggabungkan musik dengan AI. Google sebelumnya mengembangkan MusicLM, model bahasa besar yang menghasilkan beberapa menit suara berdasarkan petunjuk teks dan hanya dapat diakses oleh peneliti.
Kemudian, lagu "yang dihasilkan AI" yang menampilkan kemiripan suara Drake dan The Weeknd menjadi viral sebelum dihapus. Baru-baru ini, beberapa musisi, seperti Grimes, mendorong orang untuk menggunakan suara mereka dalam lagu buatan AI.
Tentu saja, para musisi telah bereksperimen dengan audio elektronik sejak lama; EDM dan festival seperti Ultra tidak muncul begitu saja. Tetapi musik yang dihasilkan komputer sering terdengar dimanipulasi dari audio yang ada. AudioCraft dan musik produksi AI generatif lainnya membuat suara tersebut hanya dari teks dan perpustakaan data suara yang luas.
Saat ini, AudioCraft terdengar seperti sesuatu yang dapat digunakan untuk musik elevator atau lagu stok yang dapat dipasang untuk suasana tertentu daripada hit pop besar berikutnya. Namun, Meta yakin model barunya dapat mengantarkan gelombang lagu baru dengan cara yang sama seperti synthesizer mengubah musik setelah menjadi populer. “Kami pikir MusicGen dapat berubah menjadi instrumen jenis baru sama seperti synthesizer saat pertama kali muncul,” kata perusahaan tersebut dalam sebuah blog, dikutip dari The Verge, Rabu (2/8/2023).
Meta mengakui sulitnya membuat model AI yang mampu menghasilkan musik karena audio sering kali mengandung jutaan poin di mana model melakukan tindakan dibandingkan dengan model teks tertulis seperti Llama 2 yang hanya berisi ribuan.
Perusahaan mengatakan AudioCraft membutuhkan sumber terbuka untuk mendiversifikasi data yang digunakan untuk melatihnya.
Label rekaman dan artis telah menyuarakan tentang bahaya AI, karena banyak yang khawatir bahwa itu bisa mengambil materi berhak cipta untuk pelatihan, dan secara historis, mereka adalah kelompok yang sadar hukum.