Vad är ljudbrytning?
Audio Mining används vanligtvis i programvara för taligenkänning och musikanalys. Denna teknik ger användaren möjlighet att söka genom tal- eller musikljud som har analyserats för specifika egenskaper. När de används i Taligenkänningsteknik identifierar ljudbrytning talade ord i ljudet och sätter dem i en sökbar fil. Den här funktionen kan vara användbar för studenter eller de i näringslivet som deltar i många möten eftersom den gör att användaren lättare kan bläddra i aktuell information från talpresentationer. Denna typ av analys kan också användas i musik för att bestämma egenskaper som beats per minut (BPM), musikalisk nyckel och musikalisk struktur, information som används för att klassificera musik.
I taligenkänning, där tekniken oftast används, används ljudbrytning för att skapa en akustisk modell. En akustisk modell programmerar taligenkänningsprogramvara för att känna igen talmönster som ord. Denna teknik utvecklas genom ljudbrytning av en RECOrding av en talad fras, som jämförs med text som matchar den talade frasen. Datorn använder informationen för att känna igen ord när användaren gör liknande ljud som de i den akustiska modellen. En akustisk modell används i kombination med en fil som berättar taligenkänningsprogrammet vilket språk som ska tolkas och vilka ordmönster som sannolikt kommer att talas i vissa meningar och situationer.
Musiker och musiklyssnare kan båda dra nytta av ljudbrytning i musik. Ibland använder musikprogramvara som kategoriserar musik efter genre ljudbrytning för att organisera musiken. Processen identifierar och grupperar musikfiler med ljudlikheter som ofta förekommer i musikaliska genrer. Även om denna teknik kan underlätta organisering av musik och hitta ny musik, kan den underlätta misstag att klassificera låtar som har liknande uppmätta egenskaper men olika övergripande ljud. Ljudanalys SOFTware kan vara användbart för musiker, särskilt kompositörer, eftersom det gör att kompositören kan hoppa till specifika delar av sångstrukturen, inklusive musikaliska nyckelförändringar och ord inom texterna.
Programvarutillverkaren Dragon® säljer ett program som heter Audiomining® som transkriberar ljudfiler och markerar filerna så att de kan sökas efter text. Dragon är en tillverkare av datorspråkistiska program, den tekniska termen för programvaran som är utformad för att tolka tal. Ljudbrytning, när den används som två ord, är en allmän term som hänvisar till att analysera en ljudfil för en bestämd uppsättning ljudegenskaper. Andra tillverkare av ljudbrytningsprogramvara inkluderar Nuance® och Nexidia®.