Penelitian Terjemahan Mesin AI Meta Membantu Mendobrak Hambatan Bahasa

sumber gambar : pixabay

Hari ini, Meta mengumumkan bahwa mereka telah membangun dan open source 'No Language Left Behind' NLLB-200, model AI tunggal yang pertama kali menerjemahkan di 200 bahasa yang berbeda, termasuk 55 bahasa Afrika dengan hasil mutakhir. Meta menggunakan teknik pemodelan dan pembelajaran dari proyek untuk meningkatkan dan memperluas terjemahan di Facebook, Instagram, dan Wikipedia.

Baca juga : TWITTER MENUNTUT ELON MUSK, MEMAKSANYA UNTUK MENGHORMATI PERJANJIAN PENGGABUNGAN

Dalam upaya mengembangkan kemampuan terjemahan mesin berkualitas tinggi untuk sebagian besar bahasa dengan sumber daya rendah di dunia, model AI tunggal ini dirancang dengan fokus pada bahasa Afrika. Mereka menantang dari perspektif terjemahan mesin. Model AI membutuhkan banyak sekali data untuk membantu mereka belajar, dan tidak banyak data pelatihan yang diterjemahkan oleh manusia untuk bahasa-bahasa ini. Misalnya, ada lebih dari 20 juta orang yang berbicara dan menulis dalam bahasa Luganda tetapi contoh bahasa tertulis ini sangat sulit ditemukan di internet.

Kami bekerja dengan penerjemah profesional untuk masing-masing bahasa ini untuk mengembangkan tolak ukur yang andal yang dapat secara otomatis menilai kualitas terjemahan untuk banyak bahasa dengan sumber daya rendah. Kami juga bekerja dengan penerjemah profesional untuk melakukan evaluasi manusia juga, artinya orang yang berbicara bahasa tersebut secara asli mengevaluasi apa yang dihasilkan AI. Kenyataannya adalah bahwa beberapa bahasa mendominasi web, sehingga hanya sebagian kecil dari dunia yang dapat mengakses konten dan berkontribusi ke web dalam bahasa mereka sendiri. Kami ingin mengubah ini dengan membuat sistem terjemahan mesin yang lebih inklusif – sistem yang membuka akses ke web untuk lebih dari 4 miliar orang di seluruh dunia yang saat ini dikecualikan karena mereka tidak berbicara salah satu dari sedikit bahasa yang tersedia di konten.

Baca Juga : MUNGKINKAH SMARTPHONE "NOTHING" BENAR-BENAR MENJADI ANCAMAN BAGI IPHONE APPLE?

“Sungguh mengesankan betapa AI meningkatkan semua layanan kami. Kami baru saja membuka sumber model AI yang kami buat yang dapat menerjemahkan ke dalam 200 bahasa yang berbeda — banyak di antaranya tidak didukung oleh sistem terjemahan saat ini. Kami menyebut proyek ini No Language Left Behind, dan teknik pemodelan AI yang kami gunakan membantu membuat terjemahan berkualitas tinggi untuk bahasa yang digunakan oleh miliaran orang di seluruh dunia. Untuk mengetahui skalanya, model 200 bahasa memiliki lebih dari 50 miliar parameter, dan kami melatihnya menggunakan Research SuperCluster baru kami, yang merupakan salah satu superkomputer AI tercepat di dunia. Kemajuan di sini akan memungkinkan lebih dari 25 miliar terjemahan setiap hari di seluruh aplikasi kami. Berkomunikasi lintas bahasa adalah salah satu kekuatan super yang disediakan AI, tetapi seiring kami terus memajukan pekerjaan AI kami, ini meningkatkan semua yang kami lakukan — mulai dari menampilkan konten paling menarik di Facebook dan Instagram, hingga merekomendasikan iklan yang lebih relevan, hingga menjaga layanan kami tetap aman untuk semua orang.

Bahasa adalah budaya, identitas, dan garis hidup kita bagi dunia. Namun, karena alat terjemahan berkualitas tinggi tidak tersedia untuk ratusan bahasa, miliaran orang saat ini tidak dapat mengakses konten digital atau berpartisipasi penuh dalam percakapan dan komunitas online dalam bahasa pilihan atau bahasa ibu mereka. Hal ini terutama berlaku untuk ratusan juta orang yang berbicara dalam banyak bahasa di Afrika.

Baca Juga : SPESIFIKASI DAN HARGA TECNO CAMON 19 PRO UNTUK PASAR NIGERIA

“Afrika adalah benua dengan keragaman bahasa yang sangat tinggi, dan hambatan bahasa ada dari hari ke hari. Kami dengan senang hati mengumumkan bahwa 55 bahasa Afrika akan dimasukkan dalam penelitian terjemahan mesin ini, menjadikannya terobosan besar bagi benua kami,” kata Balkissa Ide Siddo, Direktur Kebijakan Publik untuk Afrika saat berbicara tentang peluncuran model AI. “Di masa depan, bayangkan mengunjungi grup Facebook favorit Anda, menemukan posting di Igbo atau Luganda, dan dapat memahaminya dalam bahasa Anda sendiri hanya dengan mengklik tombol – kami berharap penelitian seperti ini membawa kita ke sana. Terjemahan yang sangat akurat dalam lebih banyak bahasa juga dapat membantu menemukan konten berbahaya dan informasi yang salah, melindungi integritas pemilu, dan mengekang contoh eksploitasi seksual online dan perdagangan manusia.”

Saat mengomentari aksesibilitas dan inklusi dalam upaya membangun metaverse yang adil, Ide Siddo menambahkan “Di Meta, kami bekerja hari ini untuk memastikan bahwa sebanyak mungkin orang akan dapat mengakses peluang pendidikan, sosial dan ekonomi baru yang akan datang di masa depan. evolusi internet akan membawa teknologi masa depan dan pengalaman hidup sehari-hari.”

Untuk memastikan bahwa terjemahannya berkualitas tinggi, Meta juga membuat kumpulan data evaluasi baru, FLORES-200, dan mengukur kinerja NLLB-200 dalam setiap bahasa. Hasil mengungkapkan bahwa NLLB-200 melebihi keadaan seni sebelumnya dengan rata-rata 44 persen.

Baca Juga : DALAM UPAYA UNTUK MENGHINDARI DENDA UE, AMAZON MENYETUJUI PROGRAM PENJUAL YANG LEBIH ADIL

Meta juga membuka sumber model NLLB-200 dan menerbitkan banyak alat penelitian untuk memungkinkan peneliti lain memperluas pekerjaan ini ke lebih banyak bahasa dan membangun teknologi yang lebih inklusif. Meta AI juga memberikan hibah hingga $200.000 kepada organisasi nirlaba untuk aplikasi dunia nyata untuk NLLB-200.

Ada versi Wikipedia dalam lebih dari 300 bahasa, tetapi sebagian besar memiliki artikel yang jauh lebih sedikit daripada 6+ juta yang tersedia dalam bahasa Inggris. Mengikuti kemitraan Meta dengan Wikimedia Foundation, organisasi nirlaba yang menyelenggarakan Wikipedia dan proyek pengetahuan gratis lainnya, teknik pemodelan dan pembelajaran dari penelitian NLLB kini juga diterapkan pada sistem terjemahan yang digunakan oleh editor Wikipedia. Dengan menggunakan Alat Penerjemahan Konten dari Wikimedia Foundation, artikel sekarang dapat dengan mudah diterjemahkan ke lebih dari 20 bahasa sumber daya rendah (yang tidak memiliki kumpulan data ekstensif untuk melatih sistem AI), termasuk 10 yang sebelumnya tidak didukung oleh alat terjemahan mesin apa pun di platform.

sumber gambar : pixabay





Posting Komentar

0 Komentar

Close Menu