Speech recognition
Speech recognition atau yang dikenal juga sebagai pengenalan suara
otomatis bekerja dengan mengkonversi kata yang diucapkan dengan teks.
Pengenalan suara adalah sebuah sistem yang dilatih untuk pengguna
tertentu sehingga seseorang dapat mengakui ucapan mereka berdasarkan
suara vokal mereka yang unik.
Aplikasi speech recognition diantaranya :
- “Call home”
- “call routing”
- “domotic appliance control and content-based spoken audio search”
- entri data sederhana (misalnya memasukkan nomor kartu kredit)
- penyusunan dokumen terstruktur (misalnya sebuah laporan radiologi)
- pidato-untuk-pengolahan teks (misalnya pengolah kata atau email)
- dalam pesawat terbang cockpits ( biasanya disebut Direct Voice Input)
Berikut awal mula ditemukan teknologi speech recognition dari tahun ke tahun
1874 :
Alexander Graham Bell berhasil
membuktikkan bahwa frekuensi harmoni dari sebuah sinyal elektrik dapat
dibagi-bagi yang kemudian hari berlanjut pada digitalisasi ucapan.
1952 :
Bell Labs mengembangkan speech
recognizer pertama dengan menggunakan teknologi pemisah frekuensi yang
serupa dengan teknologi yang dikembangkan oleh Alexander Graham Bell.
1971-1976 :
Defence Advance Research Project Agency
dibentuk yang merupakan proyek riset dengan dana dari pemerintah AS.
Tujuan dari proyek ini adalah untuk melakukan penelitian teknologi
speech recognition. Penemuan terbesar yang dihasilkan proyek ini adalah
peningkatan dalam menekan permasalahan variabilitas suara. Pada rentang
tahun yang sama pula ditemukan :
- Pemrograman dinamik oleh tiga peneliti asal Jepang, Itakura, Skoe,
dan Chiba yang dikemudian hari menjadi dasar bagi deret waktu
non-linier.
- Pemodelan Makov oleh Jim Baker dan Fred Jelinek dari IBM yang
merupakan pemodelan untuk menentukan letak informasi tetap dalam sebuah
sinyal wicara (speech signal).
Pertengahan tahun 1970-an :
Itakura mengadakan sebuah riset untuk
mengembangkan sebuah produk yang berbasis pada asumsi bahwa noise itu
walaupun terdengar sama namun pada kenyataannya tidak demikian. Produk
tersebut akurasinya mencapai 97,3% saat diuji menggunakan 200 kosakata.
Bell Labs mengembangkan sistem yang mampu mengenali suara dari orang-orang yang berbeda dengan akurasi hingga 97,1%.
Akhir 1970-an :
Produk speech recognition pertama mulai dipasarkan dengan harga mulai $259 hingga $100.000.
1980-an :
Pasaran speech recognition mulai
digolongkan menjadi dua, yaitu Call Center Speech Recognition System dan
Speech-to-Text Application.
1990-an :
Prosesor sebuah personal computer telah
sanggup memenuhi level minimal yang diperlukan agar sebuah software
speech recognition dapat berjalan dengan lancar serta efektif untuk
penggunaan pribadi.
1999 :
Sebuah program speech recognition baru
telah mampu memahami pembicaraan manusia secara berkesinambungan dengan
tingkat akurasi hingga 99% yang membuatnya dapat dengan mudah digunakan
oleh pengguna awam sekaligus.
Contoh yang paling sederhana pemanfaatan teknologi
Speech Recognition
adalah voice dial yang sempat menjadi fitur andalan ponsel-ponsel
high-end akhir dekade yang lalu. Sedangkan pengaplikasian mutakhir
teknologi ini dapat dijumpai pada layanan call center, kemudian secara
otomatis komputer akan memberikan solusinya.
Penerapan
Speech Recognition juga dapat ditemukan pada
beberapa aplikasi komputer yang memungkinkan Anda mengetik dokumen tanpa
harus memencet tombol-tombol
keyboard.
Cukup dengan mendiktekan kalimat-kalimat, kemudian secara otomatis
komputer akan mengetikkannya untuk Anda. Banyak software yang dirancang
untuk mengetikkan apa yang Anda katakan melalui microphone, seperti
iListen untuk komputer Mac, dan software ViaVoice keluaran IBM.
Teknologi
Speech Recognition yang dikembangkan sejak
sepuluh tahun lalu menghadapi dua pilihan, yakni menangkap percakapan
terputus (kata per kata) atau percakapan tersambung (per kalimat).
Komputer sebenarnya lebih mudah memahami suara untuk kata per kata, yang
di antara masing-masing kata terdapat jeda, namun kebanyakan orang
lebih menyukai jika teknologi ini mampu menangkap sebuah percakapan
normal.
Ref :
- http://tseljatengdiy.com/genmerapi/sejarah-speech-recognition
- 2012. All About Siri. Mobile Guide Magazine. Edisi 57, 32-33.
- http://wartawarga.gunadarma.ac.id/2010/01/contoh-teknologi-telematika-2/