Skip to main content

Hva er lydgruvedrift?

Audio Mining brukes vanligvis i talegjenkjenningsprogramvare og musikkanalyse.Denne teknologien gir brukeren muligheten til å søke gjennom tale- eller musikklyd som er analysert for spesifikke egenskaper.Når den brukes i talegjenkjenningsteknologi, identifiserer lydgruvedrift talte ord i lyden og setter dem i en søkbar fil.Denne funksjonen kan være nyttig for studenter eller de i forretningsverdenen som deltar på mange møter fordi den lar brukeren lettere bla gjennom aktuell informasjon fra talepresentasjoner.Denne typen analyser kan også brukes i musikk for å bestemme egenskaper som beats per minutt (BPM), musikalsk nøkkel og musikalsk struktur, informasjon som brukes for å klassifisere musikk.

I talegjenkjenning, der teknologien oftest brukes, brukes lydgruvedrift for å lage en akustisk modell.En akustisk modell programmerer talegjenkjenningsprogramvare for å gjenkjenne talemønstre som ord.Denne teknologien er utviklet ved lyd mining av en innspilling av en muntlig frase, som sammenlignes med tekst som samsvarer med den talte frasen.Datamaskinen bruker informasjonen for å gjenkjenne ord når brukeren lager lignende lyder som de i den akustiske modellen.En akustisk modell brukes i kombinasjon med en fil som forteller talegjenkjenningsprogrammet hvilket språk du skal tolke og hvilke ordmønstre som sannsynligvis vil bli snakket i visse setninger og situasjoner.

Musikere og musikklyttere kan begge dra nytte av lydgruvedrift i musikk.Noen ganger bruker musikkprogramvare som kategoriserer musikk etter sjanger lydgruvedrift for å organisere musikken.Prosessen identifiserer og grupper musikkfiler med lydlikheter som ofte forekommer i musikalske sjangre.Selv om denne teknologien kan gjøre organisering av musikk og finne ny musikk enklere, kan den gjøre feil å klassifisere sanger som har lignende målte egenskaper, men annerledes generell lyd.Audioanalysering av programvare kan være nyttig for musikere, spesielt komponister, fordi den lar komponisten hoppe til bestemte deler av sangstrukturen, inkludert musikalske nøkkelendringer og ord i tekstene.

Talegjenkjenningsprogramvareprodusenten Dragon Selger et program som heter Audiomining som transkriberer lydfiler og markerer filene slik at de kan søkes etter tekst.Dragon er en produsent av datamaskinspråklige programmer, den tekniske betegnelsen for programvaren som er designet for å tolke tale.Lydgruvedrift, når den brukes som to ord, er et generelt begrep som refererer til å analysere en lydfil for et bestemt sett med lydkarakteristikker.Andre produsenter av programvare for lydgruvedrift inkluderer Nuance og Nexidia reg;.