Konuşma sentezi ve tanıma, bilgisayarlı konuşma analizinin iki yüzüdür. Konuşma sentezi, bir bilgisayar tarafından insan konuşmasının oluşturulmasıdır; örneğin, yazılı metni okuyan bir bilgisayar. Konuşma tanıma, bir kağıdı bilgisayara dikte etmek gibi konuşulan sözcüklerden bilgisayar bilgisi oluşturmaktır. İki süreç doğrudan ilişkili olmasa da, konuşma sentezi ve tanınma hem bilgisayarın insan konuşmasını hem de yansımasını anlama yeteneğine dayanır. Bir yöntem çıktı, diğeri girdi.
Konuşma sentezi ve tanıma tarafından kullanılan işlemler, nihai ürün farklı olsa bile çok benzerdir. Süreç, bir kısmı insan etkileşimi ve biri olmayan iki bölümden oluşur. İnsan kısmı, programın insan kelimelerinin programa girdiği zamandır; insan olmayan kısım, programın girişi birlikte çalıştırdığı zamandır.
Bir konuşma sentezi programı, insan girdisini formda veya yazılı veya yazılı insan dilinde alacaktır. Program dili okuyacak ve her bir kelimenin ne olduğunu belirleyecektir, cümle yerleştirme ve noktalama işaretini kullanarak çekimi. Bir kelimenin 'canlı' olması gibi birçok yolla söylenebilmesi durumunda, program gerçekten hangi kelimenin kullanıldığını belirlemek için yakındaki kelimeleri ve bağlam ipuçlarını arayacaktır. Sözler daha sonra programın ikinci bölümüne gider, burada sesli olarak konuşulur.
Bir konuşma tanıma programında işlem tam tersidir. Giriş, kelimeleri bilgisayara söyleyen bir insan konuşmacıdan geliyor. Bilgisayar her bir kelimeyi dinleyecek ve konuşmacının sesi tarafından üretilen deseni olası sesler ve sözcüklerden oluşan bir kütüphaneyle karşılaştıracaktır. Daha sonra en muhtemel kelimenin tespitini yapar ve onu sistemin ikinci kısmına gönderir. Bu kısım, sentez programının kelimeleri söylediği gibi, aslında kelimeleri ekranda yazdırıyor.
Her konuşmacı biraz farklı göründüğü için, konuşma sentezi ve tanıma programları genellikle geniş bir hata payına sahiptir. İnsanların bu hatalarla mücadele yollarından biri de bireysel konuşma profilleridir. Tek bir konuşmacı, kendi ses düzenlerini bulmak için program tarafından konuşmasını analiz edecektir. Bilgisayar çevirisinde hatalar bulduğunda, onları özellikle düzeltebilir. Düzeltmeler program tarafından analiz edilir ve saklanır, böylece sorunlu kelime tekrar geldiğinde program doğru şekilde çevirir.
Konuşma sentezi ve tanıma programları için geniş bir uygulama var. Tıp alanında, bu programlar insanların başka türlü yapamayacakları kişileri iletişim kurmalarına izin verir. Bu programların, raporları ve belgeleri çevirmenin daha hızlı bir yolu olarak iş dünyasında geniş bir uygulama alanı vardır. Konuşma tanıma özelliği, otomobillerde ahizesiz kullanım cihazlarının kurulmasında yaygın bir yöntemdir ve araç kullanırken insanların telefonda daha güvenli bir şekilde konuşmalarını sağlar.


