Vad är ljudtranskription?

Ljudtranskription är processen att ta talade ord och göra dem till skriftlig text. Tidigare skulle en person sitta och skriva ord som de talades. Nu finns ljudinspelningar av olika slag och flera transkriptionsmetoder. Analoga och digitala inspelningsmetoder gör det möjligt för en person som inte är närvarande under samtalet att fortfarande transkribera texten. Dessutom kommer många mjukvarupaket att läsa ljudfiler och snabbt konvertera dem till text utan att behöva spela dem faktiskt.

Under många år var transkription av ljud ett specialiserat och tråkigt yrke. Människor som transkriberade tal måste vara närvarande när de talade, vilket ofta innebär att företag skulle behöva anställa personer utbildade i avancerad teknik som korthet. Detta begränsade också transkriptionstjänster till dem som hade tillgång till en utbildad transkription.

Med uppfinningen av ljudinspelningar förändrades detta fält dramatiskt. Med en inspelning kunde transkriptionen arbeta var som helst där inspelningen kunde levereras. Dessutom behövde transkription inte längre kortfattat eftersom inspelningen kunde vändas och lyssnas på flera gånger. En enda transkriberare kunde också arbeta för en mängd klienter samtidigt, eftersom hon inte längre behövde vara närvarande för talarna.

Med ökningen i datoranvändning och Internethastigheter förblev området för ljudtranskription i stort sett detsamma. Filer, snarare än band, mailades ofta istället för att skickas med vanlig post. Processens hastighet ökade, men metoderna gjorde det inte.

Detta förändrades i slutet av 90-talet med den ökande användningen av programvara för taligenkänning och diktation. Jobbet med att transkribera gick mer och mer mot datorhjälp och sedan full automatisering. Det kom ut programvarupaket som kunde läsa informationen i en ljudfil och använda högtalarens vågmönster för att bygga en textversion av ett tal. Detta skulle ta sekunder snarare än minuter eller timmar för en mänsklig transkription.

Datorautomatisk ljudtranskription har några brister som är svåra att övervinna, varav den största är en relativ brist på korrigerande tal. När en mänsklig transkriberare lyssnar på text kan hon korrigera små fel i talet för att göra det mer läsbart. Även om en del transkription är verbatim, vilket betyder att det är exakt vad personen sa, är det mest inte. Utan korrigerande tal måste en människa ofta kontrollera transkriptionen för fel innan den används.

Den andra vanliga bristen i datorbaserad ljudtranskription ligger i människors tal. Eftersom människor har ett enormt utbud av toner och mönster när de talar, är det oerhört svårt att skapa ett datorprogram som kan läsa och översätta hela sortimentet exakt. Detta innebär att en viss mängd fel är vanligt i nästan all transkriptionsprogramvara. Det vanligaste sättet att arbeta kring denna brist är genom lärt tal, där programmet och en enda högtalare arbetar tillsammans så att programmet fokuserar på den enskildes mönster.

Vad är ljudtranskription?

Hjälpte den här artikeln dig?