BerandaComputers and TechnologyAI mengungguli manusia dalam pengenalan ucapan

AI mengungguli manusia dalam pengenalan ucapan

AI outperforms humans in speech recognition
Berkat sistem pengenalan ucapannya yang superior, Penerjemah Kuliah KIT akan memberikan hasil yang lebih baik dengan latensi minimum di masa mendatang. Kredit: KIT

Mengikuti percakapan dan menyalinnya dengan tepat adalah salah satu tantangan terbesar dalam penelitian kecerdasan buatan (AI). Untuk pertama kalinya hingga saat ini, para peneliti dari Karlsruhe Institute of Technology (KIT) berhasil mengembangkan sistem komputer yang mengungguli manusia dalam mengenali bahasa yang diucapkan secara spontan dengan latensi minimum. Ini dilaporkan di arXiv.org.

“Ketika orang berbicara satu sama lain, ada yang berhenti, gagap, ragu-ragu, seperti ‘er’ atau ‘hmmm,’ tertawa dan batuk,” kata Alex Waibel, Profesor untuk Informatika di KIT. “Seringkali, kata-kata diucapkan dengan tidak jelas.” Hal ini membuat orang sulit bahkan untuk membuat catatan percakapan yang akurat. “Dan sejauh ini, ini bahkan lebih sulit bagi AI.” Ilmuwan KIT dan staf KITES, sebuah perusahaan start-up dari KIT, kini telah memprogram sistem komputer yang menjalankan tugas ini lebih baik daripada manusia dan lebih cepat dari sistem lain.

Waibel telah mengembangkan penerjemah langsung otomatis yang secara langsung menerjemahkan kuliah universitas dari bahasa Jerman atau Inggris ke dalam bahasa yang digunakan oleh mahasiswa asing. “Penerjemah Kuliah” ini telah digunakan di ruang kuliah KIT sejak 2012. “Pengenalan pidato spontan adalah komponen terpenting dari sistem ini, “jelas Waibel,” karena kesalahan dan keterlambatan dalam pengenalan membuat terjemahan tidak bisa dipahami. Pada percakapan percakapan, manusia berjumlah sekitar 5,5%. Sistem kami sekarang mencapai 5,0%. ” Selain presisi, kecepatan sistem untuk menghasilkan keluaran juga sama pentingnya sehingga mahasiswa dapat mengikuti perkuliahan secara langsung. Para peneliti sekarang telah berhasil mengurangi ini menjadi satu detik. Ini adalah latensi terkecil yang dilaporkan yang dicapai oleh sistem pengenalan suara dengan kualitas ini hingga saat ini, kata Waibel.

Tingkat kesalahan dan latensi diukur menggunakan uji “tolok ukur switchboard” standar dan yang diakui secara internasional. Tolok ukur ini (didefinisikan oleh US NIST) banyak digunakan oleh peneliti AI internasional dalam persaingan mereka untuk membuat mesin yang mendekati manusia dalam mengenali ucapan spontan dalam kondisi yang sebanding, atau bahkan mengungguli mereka.

Menurut Waibel, pengenalan ucapan yang cepat dan akurat adalah langkah penting untuk pemrosesan hilir lebih lanjut. Ini memungkinkan dialog, terjemahan, dan modul AI lainnya untuk menyediakan interaksi berbasis suara yang lebih baik dengan mesin.



Informasi lebih lanjut: Nguyen et al., Kinerja Manusia Super dalam Pengenalan Online Low-latency dari Pidato Percakapan. arXiv: 2010.03449 [cs.CV]. arxiv.org/abs/2010.03449

Kutipan: AI mengungguli manusia dalam pengenalan ucapan (2020, 20 Oktober) diakses pada 22 Oktober 2020 dari https://techxplore.com/news/2020-10-ai-outperforms-humans-speech-recognition.html

Dokumen ini memiliki hak cipta. Terlepas dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak sebagian boleh diperbanyak tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.

Read More

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular

Recent Comments