Jumat, 12 Oktober 2012

Sekilas Tentang Speech Recognition

Speech recognition
Speech recognition atau yang dikenal juga sebagai pengenalan suara otomatis bekerja dengan mengkonversi kata yang diucapkan dengan teks. Pengenalan suara adalah sebuah sistem yang dilatih untuk pengguna tertentu sehingga seseorang dapat mengakui ucapan mereka berdasarkan suara vokal mereka yang unik.
Aplikasi speech recognition diantaranya :
- “Call home”
- “call routing”
- “domotic appliance control and content-based spoken audio search”
- entri data sederhana (misalnya memasukkan nomor kartu kredit)
- penyusunan dokumen terstruktur (misalnya sebuah laporan radiologi)
- pidato-untuk-pengolahan teks (misalnya pengolah kata atau email)
- dalam pesawat terbang cockpits ( biasanya disebut Direct Voice Input)
Berikut awal mula ditemukan teknologi speech recognition dari tahun ke tahun

1874 :
Alexander Graham Bell berhasil membuktikkan bahwa frekuensi harmoni dari sebuah sinyal elektrik dapat dibagi-bagi yang kemudian hari berlanjut pada digitalisasi ucapan.
1952 :
Bell Labs mengembangkan speech recognizer pertama dengan menggunakan teknologi pemisah frekuensi yang serupa dengan teknologi yang dikembangkan oleh Alexander Graham Bell.
1971-1976 :
Defence Advance Research Project Agency dibentuk yang merupakan proyek riset dengan dana dari pemerintah AS. Tujuan dari proyek ini adalah untuk melakukan penelitian teknologi speech recognition. Penemuan terbesar yang dihasilkan proyek ini adalah peningkatan dalam menekan permasalahan variabilitas suara. Pada rentang tahun yang sama pula ditemukan :
  • Pemrograman dinamik oleh tiga peneliti asal Jepang, Itakura, Skoe, dan Chiba yang dikemudian hari menjadi dasar bagi deret waktu non-linier.
  • Pemodelan Makov oleh Jim Baker dan Fred Jelinek dari IBM yang merupakan pemodelan untuk menentukan letak informasi tetap dalam sebuah sinyal wicara (speech signal).
Pertengahan tahun 1970-an :
Itakura mengadakan sebuah riset untuk mengembangkan sebuah produk yang berbasis pada asumsi bahwa noise itu walaupun terdengar sama namun pada kenyataannya tidak demikian. Produk tersebut akurasinya mencapai 97,3% saat diuji menggunakan 200 kosakata.
Bell Labs mengembangkan sistem yang mampu mengenali suara dari orang-orang yang berbeda dengan akurasi hingga 97,1%.
Akhir 1970-an :
Produk speech recognition pertama mulai dipasarkan dengan harga mulai $259 hingga $100.000.
1980-an :
Pasaran speech recognition mulai digolongkan menjadi dua, yaitu Call Center Speech Recognition System dan Speech-to-Text Application.
1990-an :
Prosesor sebuah personal computer telah sanggup memenuhi level minimal yang diperlukan agar sebuah software speech recognition dapat berjalan dengan lancar serta efektif untuk penggunaan pribadi.
1999 :
Sebuah program speech recognition baru telah mampu memahami pembicaraan manusia secara berkesinambungan dengan tingkat akurasi hingga 99% yang membuatnya dapat dengan mudah digunakan oleh pengguna awam sekaligus.

Contoh yang paling sederhana pemanfaatan teknologi Speech Recognition adalah voice dial yang sempat menjadi fitur andalan ponsel-ponsel high-end akhir dekade yang lalu. Sedangkan pengaplikasian mutakhir teknologi ini dapat dijumpai pada layanan call center, kemudian secara otomatis komputer akan memberikan solusinya.

Penerapan Speech Recognition juga dapat ditemukan pada beberapa aplikasi komputer yang memungkinkan Anda mengetik dokumen tanpa harus memencet tombol-tombol keyboard. Cukup dengan mendiktekan kalimat-kalimat, kemudian secara otomatis komputer akan mengetikkannya untuk Anda. Banyak software yang dirancang untuk mengetikkan apa yang Anda katakan melalui microphone, seperti iListen untuk komputer Mac, dan software ViaVoice keluaran IBM.

Teknologi Speech Recognition yang dikembangkan sejak sepuluh tahun lalu menghadapi dua pilihan, yakni menangkap percakapan terputus (kata per kata) atau percakapan tersambung (per kalimat). Komputer sebenarnya lebih mudah memahami suara untuk kata per kata, yang di antara masing-masing kata terdapat jeda, namun kebanyakan orang lebih menyukai jika teknologi ini mampu menangkap sebuah percakapan normal.

Ref :
  • http://tseljatengdiy.com/genmerapi/sejarah-speech-recognition
  • 2012. All About Siri.  Mobile Guide Magazine. Edisi 57, 32-33.
  • http://wartawarga.gunadarma.ac.id/2010/01/contoh-teknologi-telematika-2/



Tidak ada komentar:

Posting Komentar