Skip to main content

Vad är ljudbrytning?

Ljudbrytning används vanligtvis i programvara för taligenkänning och musikanalys.Denna teknik ger användaren möjlighet att söka genom tal- eller musikljud som har analyserats för specifika egenskaper.När de används i Taligenkänningsteknik identifierar ljudbrytning talade ord i ljudet och sätter dem i en sökbar fil.Den här funktionen kan vara användbar för studenter eller de i näringslivet som deltar i många möten eftersom den gör att användaren lättare kan bläddra i aktuell information från talpresentationer.Denna typ av analys kan också användas i musik för att bestämma egenskaper som beats per minut (BPM), musikalisk nyckel och musikalisk struktur, information som används för att klassificera musik.

I taligenkänning, där tekniken oftast används, används ljudbrytning för att skapa en akustisk modell.En akustisk modell programmerar taligenkänningsprogramvara för att känna igen talmönster som ord.Denna teknik utvecklas genom ljudbrytning av en inspelning av en talad fras, som jämförs med text som matchar den talade frasen.Datorn använder informationen för att känna igen ord när användaren gör liknande ljud som de i den akustiska modellen.En akustisk modell används i kombination med en fil som berättar för taligenkänningsprogrammet vilket språk som ska tolkas och vilka ordmönster som sannolikt kommer att talas i vissa meningar och situationer.

Musiker och musiklyssnare kan både dra nytta av ljudbrytning i musik.Ibland använder musikprogramvara som kategoriserar musik efter genre ljudbrytning för att organisera musiken.Processen identifierar och grupperar musikfiler med ljudlikheter som ofta förekommer i musikaliska genrer.Även om den här tekniken kan underlätta organisering av musik och hitta ny musik, kan den underlätta misstag att klassificera låtar som har liknande uppmätta egenskaper men olika övergripande ljud.Ljudanalysprogramvara kan vara användbar för musiker, särskilt kompositörer, eftersom det gör det möjligt för kompositören att hoppa till specifika delar av låtstrukturen, inklusive musikaliska nyckelförändringar och ord inom texterna.

Tillverkaren av taligenkänningsprogramvaran Dragon säljer ett program som heter Audiomining Det transkriberar ljudfiler och markerar filerna så att de kan sökas efter text.Dragon är en tillverkare av datorspråkistiska program, den tekniska termen för programvaran som är utformad för att tolka tal.Ljudbrytning, när den används som två ord, är en allmän term som hänvisar till att analysera en ljudfil för en bestämd uppsättning ljudegenskaper.Andra tillverkare av ljudbrytningsprogramvara inkluderar Nuance och nexidia reg;.