การถอดเสียงคืออะไร?

การถอดเสียงเป็นกระบวนการของการพูดคำและทำให้พวกเขาเป็นข้อความที่เขียน ในอดีตคน ๆ หนึ่งจะนั่งและเขียนคำตามที่พูด ตอนนี้การบันทึกเสียงประเภทต่างๆและวิธีการถอดรหัสหลายวิธีมีอยู่แล้ว วิธีการบันทึกแบบอนาล็อกและดิจิตอลจะอนุญาตให้บุคคลที่ไม่ได้อยู่ในระหว่างการพูดคุยยังคงถอดความข้อความ นอกจากนี้แพคเกจซอฟต์แวร์จำนวนมากจะอ่านไฟล์เสียงและแปลงเป็นข้อความอย่างรวดเร็วโดยไม่ต้องเล่นจริง

หลายปีที่ผ่านมาการถอดเสียงเป็นอาชีพที่น่าเบื่อหน่าย คนที่คัดลอกคำพูดจะต้องนำเสนอในเวลาที่พูดมักจะหมายถึง บริษัท จะต้องจ้างคนฝึกอบรมในเทคนิคขั้นสูงเช่นชวเลข บริการถอดความนี้ยังมีข้อ จำกัด สำหรับผู้ที่สามารถเข้าถึงผู้ใช้บริการที่ผ่านการฝึกอบรมมาแล้ว

ด้วยการประดิษฐ์ของการบันทึกเสียงฟิลด์นี้เปลี่ยนไปอย่างมาก ด้วยการบันทึกผู้ใช้บริการสามารถทำงานได้จากทุกที่ที่สามารถทำการบันทึกได้ นอกจากนี้การถอดเสียงไม่จำเป็นต้องจดชวเลขอีกต่อไปเนื่องจากการบันทึกสามารถย้อนกลับและฟังได้หลายครั้ง ผู้ใช้บริการเพียงคนเดียวก็สามารถทำงานให้กับลูกค้าได้หลายคนพร้อมกันเพราะเธอไม่ต้องการที่จะนำเสนอสุนทรพจน์อีกต่อไป

ด้วยการเพิ่มขึ้นของการใช้คอมพิวเตอร์และอินเทอร์เน็ตความเร็วฟิลด์ของการถอดรหัสเสียงยังคงเหมือนเดิม ไฟล์แทนที่จะส่งเป็นอีเมลมักจะถูกส่งแทนที่จะส่งทางไปรษณีย์ธรรมดา ความเร็วของกระบวนการเพิ่มขึ้น แต่วิธีการไม่ได้

สิ่งนี้เปลี่ยนไปในช่วงปลายยุค 90 ด้วยการใช้ซอฟต์แวร์รู้จำเสียงพูดและการเขียนตามคำบอกที่เพิ่มขึ้น งานของการถอดความมีมากขึ้นเรื่อย ๆ ไปยังความช่วยเหลือด้านคอมพิวเตอร์แล้วทำงานอัตโนมัติเต็มรูปแบบ แพคเกจซอฟต์แวร์ออกมาซึ่งสามารถอ่านข้อมูลในไฟล์เสียงและใช้รูปแบบคลื่นของลำโพงเพื่อสร้างคำพูดในรูปแบบข้อความ สิ่งนี้จะใช้เวลาไม่กี่วินาทีแทนที่จะเป็นนาทีหรือชั่วโมงของผู้ใช้บริการมนุษย์

การถอดเสียงด้วยคอมพิวเตอร์โดยอัตโนมัติมีข้อบกพร่องเล็กน้อยที่ยากที่จะเอาชนะซึ่งใหญ่ที่สุดคือการขาดการพูดที่ถูกต้อง เมื่อผู้อ่านที่เป็นมนุษย์ฟังข้อความเธอสามารถแก้ไขข้อผิดพลาดเล็กน้อยในการพูดเพื่อให้อ่านได้ง่ายขึ้น ในขณะที่บางคนถอดความเป็นคำต่อคำหมายความว่ามันเป็นสิ่งที่คนพูดส่วนใหญ่ไม่ได้ หากปราศจากคำพูดที่ถูกต้องมนุษย์มักจะต้องตรวจสอบการถอดความก่อนที่มันจะถูกใช้

ข้อบกพร่องทั่วไปอื่น ๆ ของการถอดความเสียงที่ใช้คอมพิวเตอร์ตั้งอยู่ในคำพูดของมนุษย์ เนื่องจากผู้คนมีโทนสีและลวดลายที่หลากหลายเมื่อพูดการสร้างโปรแกรมคอมพิวเตอร์ที่สามารถอ่านและแปลได้อย่างแม่นยำนั้นเป็นเรื่องยาก ซึ่งหมายความว่าข้อผิดพลาดจำนวนหนึ่งเป็นเรื่องปกติในซอฟต์แวร์การถอดความเกือบทั้งหมด วิธีที่ใช้กันมากที่สุดในการแก้ไขข้อบกพร่องนี้คือการพูดผ่านการเรียนรู้โดยที่โปรแกรมและลำโพงเดียวทำงานร่วมกันได้มากพอที่โปรแกรมจะเน้นไปที่รูปแบบของบุคคลคนเดียว