Skip to main content

Cos'è un modello acustico?

Un modello acustico è essenzialmente una mappa della voce in relazione a una serie di parole stampate.Questa tecnologia viene utilizzata nei programmi di riconoscimento vocale per aiutare un computer a imparare a riconoscere i modelli vocali di una persona.Un modello acustico è uno dei due file principali necessari per eseguire un programma di riconoscimento vocale;L'altro è il modello linguistico, che indica probabili parole e schemi vocali che possono essere usati dall'altoparlante.Questi modelli vengono creati confrontando i dettagli sonori di un file audio parlato con il testo delle parole pronunciate.

Il software di riconoscimento vocale è un software progettato per riconoscere e trascrivere o rispondere alle parole che una persona dice.Molti sistemi operativi sono progettati con funzionalità di riconoscimento vocale di base integrate che l'utente può attivare e disattivare.Le funzionalità di riconoscimento vocale sui sistemi operativi di solito forniscono all'utente la possibilità di controllare il computer e digitare le parole sullo schermo usando la sua voce.

Per accedere al software di riconoscimento vocale, un utente ha bisogno di un microfono per portare la sua voce al computer, oltre a un programmaCiò elabora il suono.Mentre molti computer hanno microfoni integrati, un microfono auricolare esterno consente all'utente il vantaggio di un suono vocale più chiaro e la libertà di muoversi nella stanza mentre parlano.I marchi di software di riconoscimento vocale autonomo includono Lumenvox , Loquendo , e Dragon

La maggior parte dei programmi di riconoscimento vocale ha una programmazione del modello acustico che consente al programma di riconoscere le variazioni della pronuncia.Usano i modelli nel suono della voce degli altoparlanti per identificare le parole nel discorso.Molti sono progettati con il software di configurazione realizzato per aiutare l'utente a creare un modello acustico progettato per interpretare la propria voce.Alcuni programmi di riconoscimento vocale avanzato possono identificare e interpretare più lingue, spesso con una piccola quantità di informazioni sonore.Più un programma di riconoscimento vocale, più è probabile interpretare accuratamente le parole in base al suo contesto, incluso dove in una frase viene pronunciata una parola.

Il campo di studio che sviluppa la tecnologia di riconoscimento vocale si chiama linguistica computazionale.La linguistica computazionale prevede lo studio e il design che crea software programmato per comprendere il linguaggio umano.Questo campo spesso incorpora informazioni dallo studio della psicologia per creare modelli acustici che possano interpretare in modo più accurato il linguaggio.

La parola acustica generalmente si riferisce a tutto ciò che ha a che fare con il suono.Sebbene i modelli acustici siano spesso usati nel riconoscimento vocale, possono anche essere usati nella musica.Un modello acustico di una pista musicale può identificare proprietà come beat al minuto, chiavi musicali o tiri dominanti nella musica.Queste informazioni possono essere utilizzate da un programma per computer per identificare una traccia musicale, oppure possono essere utilizzate per determinare liberamente il genere in cui la musica è probabilmente classificata.I modelli acustici sono anche usati in un campo di studio chiamato psicoacoustica, in cui i ricercatori sperano di imparare a strutturare la musica che colpisce prevedibilmente il cervello.