Skip to main content

Hvad er lydminedrift?

Lydminedrift bruges normalt i talegenkendelsessoftware og musikanalyse.Denne teknologi giver brugeren mulighed for at søge gennem tale- eller musiklyd, der er analyseret for specifikke egenskaber.Når det bruges i talegenkendelsesteknologi, identificerer lydminedrift talte ord i lyden og sætter dem i en søgbar fil.Denne funktion kan være nyttig for studerende eller dem i erhvervslivet, der deltager i mange møder, fordi det giver brugeren mulighed for lettere at gennemse aktuelle oplysninger fra talepræsentationer.Denne type analyse kan også bruges i musik til at bestemme egenskaber som beats pr. Minut (BPM), musikalsk nøgle og musikalsk struktur, information, der bruges til at klassificere musik.

I talegenkendelse, hvor teknologien oftest bruges, anvendes lydminedrift til at skabe en akustisk model.En akustisk model programmerer talegenkendelsessoftware til at genkende talemønstre som ord.Denne teknologi er udviklet af lydudvinding af en optagelse af en talt sætning, der sammenlignes med tekst, der matcher den talte sætning.Computeren bruger oplysningerne til at genkende ord, når brugeren giver lignende lyde som dem i den akustiske model.En akustisk model bruges i kombination med en fil, der fortæller talegenkendelsesprogrammet, hvilket sprog der skal fortolkes, og hvilke mønstre af ord, der sandsynligvis vil blive talt i visse sætninger og situationer.

Musikere og musiklyttere kan begge drage fordel af lydminedrift i musik.Nogle gange bruger musiksoftware, der kategoriserer musik af Genre, lydminedrift til at organisere musikken.Processen identificerer og grupperer musikfiler med sunde ligheder, der ofte forekommer i musikalske genrer.Selvom denne teknologi kan gøre organisering af musik og finde ny musik lettere, kan det gøre fejl, der klassificerer sange, der har lignende målte egenskaber, men forskellige samlede lyd.Audioanalyse -software kan være nyttig for musikere, især komponister, fordi det giver komponisten mulighed for at hoppe til specifikke dele af sangstrukturen, herunder musikalske nøgleændringer og ord inden for teksterne.

Producenten af talegenkendelsessoftwaren Dragon Sælger et program kaldet Audiomining Det transkriberer lydfiler og markerer filerne, så de kan søges efter tekst.Dragon er en producent af computersprogprogrammer, den tekniske betegnelse for området software designet til at fortolke tale.Lydminedrift, når den bruges som to ord, er et generelt udtryk, der henviser til analyse af en lydfil for et bestemt sæt lydegenskaber.Andre producenter af lydudviklingssoftware inkluderer nuance reg;og Nexidia .