Skip to main content

Was ist ein akustisches Modell?

Ein akustisches Modell ist im Wesentlichen eine Karte der Stimme in Bezug auf eine Reihe gedruckter Wörter.Diese Technologie wird in Spracherkennungsprogrammen verwendet, um einem Computer zu lernen, ein Person -Sprachmuster zu erkennen.Ein akustisches Modell ist eine der beiden Hauptdateien, die für die Ausführung eines Spracherkennungsprogramms erforderlich sind.Das andere ist das Sprachmodell, das wahrscheinliche Wörter und Sprachmuster anzeigt, die vom Sprecher verwendet werden können.Diese Modelle werden erstellt, indem die Tondetails einer gesprochenen Audio -Datei mit dem Text der gesprochenen Wörter verglichen werden.

Spracherkennungssoftware ist Software, die die Wörter, die eine Person sagt, erkennen und transkribieren oder darauf reagieren.Viele Betriebssysteme sind mit integrierten grundlegenden Spracherkennungsfunktionen ausgelegt, die der Benutzer ein- und ausschalten kann.Spracherkennungsfunktionen für Betriebssysteme geben dem Benutzer normalerweise die Möglichkeit, den Computer zu steuern und Wörter mithilfe ihrer Stimme auf dem Bildschirm zu tippen.

Um auf Spracherkennungssoftware zuzugreifen, benötigt ein Benutzer ein Mikrofon, um ihre Stimme auf den Computer zu bringen, sowie ein ProgrammDas verarbeitet den Ton.Während viele Computer integrierte Mikrofone haben, ermöglicht ein externes Headset-Mikrofon dem Benutzer den Vorteil eines klareren Sprachklangs und der Freiheit, sich während des Sprechens im Raum zu bewegen.Zu den eigenständigen Marken für Spracherkennungssoftware gehören Lumenvox , Loquendo und Dragon .Sie verwenden Muster im Klang der Lautsprecher Stimme, um Wörter in der Sprache zu identifizieren.Viele sind mit Setup -Software entwickelt, die dem Benutzer dabei helfen, ein akustisches Modell zu erstellen, das ihre eigene Stimme interpretieren soll.Einige erweiterte Spracherkennungsprogramme können mehrere Sprachen identifizieren und interpretieren, häufig mit einer kleinen Menge an soliden Informationen.Je fortschrittlicher ein Spracherkennungsprogramm ist, desto wahrscheinlicher ist es, Wörter auf der Grundlage seines Kontextes genau zu interpretieren, einschließlich dessen, wo in einem Satz ein Wort gesprochen wird.

Das Studiengebiet, in dem die Spracherkennungstechnologie entwickelt wird, wird als Computerlinguistik bezeichnet.Die Computer -Linguistik umfasst Studien und Design, das Software schafft, die zum Verständnis der menschlichen Sprache programmiert ist.Dieses Gebiet enthält häufig Informationen aus dem Studium der Psychologie, um akustische Modelle zu erstellen, die die Sprache genauer interpretieren können.

Das Wort akustisch bezieht sich im Allgemeinen auf alles, was mit Ton zu tun hat.Obwohl akustische Modelle am häufigsten bei der Spracherkennung verwendet werden, können sie auch in Musik verwendet werden.Ein akustisches Modell eines Musik -Tracks kann Eigenschaften wie Beats pro Minute, die Musikschlüssel oder dominante Stellplätze in der Musik identifizieren.Diese Informationen können von einem Computerprogramm verwendet werden, um einen Musik -Track zu identifizieren, oder es kann verwendet werden, um das Genre, in das die Musik wahrscheinlich kategorisiert ist, locker zu bestimmen.Akustische Modelle werden auch in einem Studiengebiet namens Psychoacustics verwendet, in dem die Forscher hoffen, Musik zu strukturieren, die vorhersehbar das Gehirn beeinflusst.