REPUBLIKA.CO.ID, JAKARTA -- Sekarang makin sulit saja mempercayai apa yang dibaca dalam Wikipedia karena akun-akun palsu telah memanipulasi entri-entri untuk ensiklopedia online itu demi uang dan untuk merusak kredibilitas situs tersebut.
Bulan lalu, Wikipedia mengumumkan telah memblokir 250 akun palsu (istilahnya sock-puppet) yang kerap dibuat pihak-pihak (perusahaan-perusahaan) guna menyunting artikel-artikel yang mengguntungkan mereka.
Untuk itu, Ragib Hasan pada Universitas Alabama di Birmingham dan para koleganya telah mengembangkan satu "tool" yang menganalisis bagaimana artikel-artikel ditulis dan ditempatkan jika mereka disunting oleh orang yang sama.
Salah satu kerja tersulit para editor Wikipedia dalam mengungkap akun-akun palsu itu adalah alamat IP dan penggunanya hanya bisa diakses oleh sejumlah kecil administrator dengan alasan privasi, kata Hasan.
Untuk itu para editor mesti menggantungkan diri pada pengalaman mereka sendiri dalam menentukan apakah akun-akun itu benar-benar digunakan untuk orang yang sama.
Tim Hasan ingin mengetahui apakah mereka bisa menggunakan algoritma dalam mengungkap akun-akun palsu tersebut dengan menganalisis bahasa yang mereka gunakan.
Tantangan saat menemukan kemiripan dalam gaya menulis itu adalah bahwa dalam penyuntingan Wikipedia, seperti halnya pada banyak tulisan di media sosial, artikel-artikelnya begitu pendek sehingga hanya sedikit material yang bisa dicermati, kata anggota tim Thamar Solorio.
Para editor Wikipedia mencermati catatan penyuntingan dari sekitar 600 akun palsu yang diselidiki Wikipedia. Ini digunakan sebagai material pelatihan untuk satu algoritma yang memindai sekitar 230 fitur tulisan, seperti ciri tata bahasanya.
Tim Wikipedia ini menunjukkan algoritma yang bisa memprediksi akun mana yang jadi-jadian dengan tingkat akurasi 75 persen.
"Investigasi sock-puppet menghabiskan banyak waktu para editor Wikipedia, sehingga apa pun yang bisa mengurangi beban kerja ini akan diterima," kata Hasan seperti dikutip New Scientist.
Mor Naaman pada Cornell Tech di New York menyukai kerja editor tim Wikipedia tersebut, namun menyebut algoritma-lagoritmanya mesti dibuat lebih akurat.
"Para editornya sangat menggantungkan diri pada fitur-fitur sintaktis, dan hanya menggunakan sejumlah kecil penanda linguistik lainnya, oleh karena itu ada ruang besar untuk peningkatan," kata Naaman.
Akun palsu adalah masalah terbaru yang dihadapi Wikipedia yang selama ini dikritik karena para editornya kebanyakan kulit putih, Barat dan 90 persen perempuan, demikian New Scientist.