Speech Recognition — Pengenalan Suara

AI yang mengkonversi audio suara menjadi teks. Aplikasi: voice assistant, transcription, captioning, dictation. Era modern: Whisper, wav2vec, Conformer.

Speech Recognition

Definisi

Speech recognition (ASR - Automatic Speech Recognition) adalah teknologi yang mengkonversi audio suara menjadi teks.

Sejarah

Sistem Modern

Aplikasi

Akurasi

Pada clean English, modern systems mencapai < 5% WER (Word Error Rate) — mendekati manusia. Pada noisy/accented, masih challenging.