Vad är ljudtranskription?

Ljudtranskription är processen att ta talade ord och göra dem till skriftlig text. Tidigare skulle en person sitta och skriva ord när de talades. Nu finns ljudinspelningar av olika typer och flera transkriptionsmetoder. Analoga och digitala inspelningsmetoder gör det möjligt för en person som inte finns under samtalet att fortfarande transkribera texten. Dessutom kommer många programvarupaket att läsa ljudfiler och konvertera dem snabbt till text utan att behöva spela dem.

Under många år var ljudtranskription ett specialiserat och tråkigt yrke. Människor som transkriberade tal måste vara närvarande vid tidpunkten för att tala, vilket ofta innebär att företag skulle behöva anställa människor utbildade i avancerade tekniker som korthet. Detta begränsade också transkriptionstjänster till dem som hade tillgång till en utbildad transkriberare.

Med uppfinningen av ljudinspelningar förändrades detta fält dramatiskt. Med en inspelning kunde transkriberaren arbeta var som helst där Rekording kunde levereras. Dessutom behövdes transkription inte längre korthet eftersom inspelningen kunde vändas och lyssnas på flera gånger. En enda transkriberare kunde också arbeta för en mängd klienter samtidigt, eftersom hon inte längre behövde vara närvarande för talarna.

Med ökningen av datoranvändning och internethastigheter förblev fältet för ljudtranskription i stort sett detsamma. Filer, snarare än band, mailades ofta istället för att skickas med normal post. Processens hastighet ökade, men metoderna gjorde det inte.

Detta förändrades i slutet av 90 -talet med den ökande användningen av taligenkänning och diktationsprogramvara. Jobbet med att transkribera gick mer och mer mot datorhjälp och sedan full automatisering. Programvarupaket kom ut som kunde läsa informationen i en ljudfil och använda högtalarens vågmönster för att bygga en textversion av en SPEECh. Detta skulle ta några sekunder snarare än minuter eller timmar för en mänsklig transkription.

dator-automatiserad ljudtranskription har några brister som är svåra att övervinna, varav den största är en relativ brist på korrigerande tal. När en mänsklig transkriberare lyssnar på text kan hon korrigera små fel i talet för att göra det mer läsbart. Medan viss transkription är ordlig, vilket betyder att det är exakt vad personen sa, är de flesta inte. Utan korrigerande tal måste en människa ofta kontrollera transkriptionen för fel innan den används.

Den andra gemensamma bristen på datorbaserad ljudtranskription ligger i själva talets tal. Eftersom människor har ett stort utbud av toner och mönster när de talar, är det exceptionellt svårt att skapa ett datorprogram som exakt kan läsa och översätta hela sortimentet. Detta innebär att ett visst fel är vanligt i nästan all transkriptionsprogramvara. Det vanligaste sättet att arbeta runt denna brist är genom Ltjänat tal, där programmet och en enda högtalare arbetar tillräckligt tillsammans för att programmet fokuserar på enskilda personens mönster.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?