Skip to main content

Hva lytter maskin?

Maskinlytting er behandling av lyder gjennom en datamaskin på en måte som etterligner menneskelig signalbehandling.Datamaskiner kan programmeres og opplæres til å gjenkjenne og tolke en rekke lydinnganger.Denne teknologien kan brukes på et bredt utvalg av måter, fra intelligensanalyse til studiet av musikk.Forskere innen dette feltet jobber ved private selskaper, akademiske institusjoner og offentlige etater for å forbedre maskinlyttingsverktøy og finne nye applikasjoner.Det integrerer elementer av akustikk, elektroteknikk, robotikk og signalbehandling.

For å gjenkjenne lyder, må datamaskiner kunne høre og behandle dem.De kan bruke lydopptak for å håndtere omgivelsesstøy, eller kan lytte til innspillinger.Lyder kan kjøres gjennom algoritmer for å bestemme hva de er og hva de skal gjøre med dem.Datasvar kan avhenge av programmering, trening og raffinement.

Et enkelt eksempel på maskinlytting kan sees med klappere og stemmeaktivert programvare.Klappere lar folk slå krets av og på med en håndklapp som aktiverer basenheten.Programvare som svarer på stemmekommandoer kan tillate folk å kontrollere det med stemmene sine, noe som krever muligheten til å identifisere stemmen og tolke lydene.Rettsmedisinske musikologer kan for eksempel sammenligne og kontrastere musikk fra forskjellige kilder og kan bruke maskinlytting i arbeidet sitt.De kan avgjøre om musikk ser ut til å ha en felles opprinnelse eller har andre egenskaper av interesse.Denne teknologien kan også brukes til å studere harmoni og utvikle teorier om hvordan historisk musikk kan ha hørtes ut.

Intelligensanalyse er også avhengig av maskinlytting.Enorme mengder lyddata i form av telefonsamtaler, diskusjoner i offentlige rom og så videre kan trenge å bli behandlet av etterretningsbyråer.Å betale mennesker for å lytte til alle lydene og utvikle rapporter kan være dyre, og kjedelige lyttere kan savne viktig informasjon.Maskinlytting kan tillate et byrå automatisk å behandle lyd for å trekke ut data som krever nøye oppmerksomhet, basert på nøkkelord, stressetoner i stemmer og andre parametere.Etterretningsanalytikere kan prioritere arbeidet sitt på grunnlag av denne automatiske analysen for å lytte til lyden som mest sannsynlig vil være viktig først.