Akustik model, esasen sesin bir dizi basılı kelimeyle ilişkili olarak haritasıdır. Bu teknoloji, bir kişinin konuşma kalıplarını tanımayı öğrenmesine yardımcı olmak için konuşma tanıma programlarında kullanılır. Akustik model, bir konuşma tanıma programını çalıştırmak için gereken iki ana dosyadan biridir; diğeri ise konuşmacı tarafından kullanılabilecek muhtemel kelimeleri ve konuşma kalıplarını gösteren dil modelidir. Bu modeller, konuşulan bir ses dosyasının ses detayları ile konuşulan kelimelerin metni karşılaştırılarak oluşturulur.
Konuşma tanıma yazılımı, bir kişinin söylediği sözcükleri tanımak ve kopyalamak veya yanıtlamak için tasarlanmış bir yazılımdır. Birçok işletim sistemi, kullanıcının açıp kapatabildiği yerleşik temel konuşma tanıma özellikleri ile tasarlanmıştır. İşletim sistemlerinde konuşma tanıma yetenekleri, genellikle bilgisayarı kontrol etme ve sesini kullanarak ekrandaki kelimeleri yazma yeteneği verir.
Konuşma tanıma yazılımına erişmek için, kullanıcının sesini bilgisayara aktarabilmesi için bir mikrofona ve sesi işleyen bir programa ihtiyacı vardır. Birçok bilgisayarda dahili mikrofon bulunurken, harici bir kulaklıklı mikrofon seti, kullanıcının daha net bir ses sesini ve konuşma sırasında odanın içinde hareket etme özgürlüğünü kullanmasını sağlar. Bağımsız konuşma tanıma yazılımı markaları arasında LumenVox®, Loquendo® ve Dragon® bulunur.
Konuşma tanıma programlarının çoğu, programın telaffuzdaki farklılıkları tanımasını sağlayan akustik model programlamasına sahiptir. Konuşmadaki kelimeleri tanımlamak için konuşmacının sesindeki kalıpları kullanırlar. Birçoğu, kullanıcının kendi sesini yorumlamak üzere tasarlanmış bir akustik model oluşturmasına yardımcı olmak için hazırlanan kurulum yazılımıyla tasarlanmıştır. Bazı gelişmiş konuşma tanıma programları, çoğu zaman küçük miktarda ses bilgisi ile birden çok dili tanımlayabilir ve yorumlayabilir. Bir konuşma tanıma programı ne kadar gelişmişse, bir cümle içinde bir kelimenin konuşulduğu yerler de dahil olmak üzere kelimeleri bağlamına göre doğru şekilde yorumlama olasılığı daha yüksektir.
Konuşma tanıma teknolojisini geliştiren çalışma alanına bilgisayar dilbilimi adı verilir. Hesaplamalı dilbilim, insan konuşmasını anlamak için programlanmış bir yazılım oluşturan çalışma ve tasarım içerir. Bu alan, konuşmayı daha doğru yorumlayabilen akustik modeller oluşturmak için psikoloji çalışmasından elde edilen bilgileri içerir.
"Akustik" kelimesi genellikle ses ile ilgisi olan herhangi bir şeyi ifade eder. Akustik modeller en sık konuşma tanımada kullanılsa da, müzikte de kullanılabilirler. Bir müzik parçasının akustik modeli, dakikadaki vuruşlar, müzik tuşları veya müzikteki baskın perdeler gibi özellikleri tanımlayabilir. Bu bilgiler bir bilgisayar programı tarafından bir müzik parçasını tanımlamak için kullanılabilir veya müziğin muhtemel olarak kategorize edildiği türü gevşek bir şekilde belirlemek için kullanılabilir. Akustik modeller ayrıca, araştırmacıların beyni tahmin edilebilecek bir şekilde beynini etkileyen müzik yapmayı öğrenmeyi umdukları psikoakustik adı verilen bir çalışma alanında da kullanılmaktadır.


