Skip to main content

การสังเคราะห์คำพูดคืออะไร?

การสังเคราะห์คำพูดเป็นกระบวนการที่การสื่อสารด้วยวาจาซ้ำผ่านอุปกรณ์ประดิษฐ์คอมพิวเตอร์ที่แปลงข้อความเป็นคำพูดเป็นหนึ่งในการสังเคราะห์คำพูด

รูปแบบแรกของการสังเคราะห์การพูดถูกนำมาใช้ผ่านเครื่องจักรที่ออกแบบมาเพื่อทำหน้าที่เหมือนทางเดินเสียงของมนุษย์เครื่องพูดที่สร้างโดย Wolfgang von Kempelen ในปี 1700 เป็นตัวอย่างด้วยอุปกรณ์นี้คำพูดถูกสร้างขึ้นผ่านเสียงร้องของห้องครัวกกปี่และระฆังคลาริเน็ตตะโกนในครัวได้รับการออกแบบให้ทำตัวเหมือนปอดในขณะที่สายลม (พื้นที่ของสายเสียง) ถูกแสดงผ่านกกกกเสียงระฆังคลาริเน็ตทำหน้าที่เป็นปาก

การทำงานของอุปกรณ์นั้นเป็นแบบแมนนวลอย่างสมบูรณ์มือขวาควบคุมชุดของคันโยกในขณะที่มือซ้ายจัดการระฆังคลาริเน็ต (ปาก)นอกจากนี้ยังมีตัวเลือกในการเสียบ 'รูจมูก' เพื่อสร้างเสียงจมูกน้อยลงไม่ว่าจะด้วยวิธีใดตราบใดที่การควบคุมพื้นฐานถูกนำมาใช้อย่างเหมาะสมเครื่องจะได้รับการไหลเวียนของอากาศการไหลเวียนของอากาศนี้กำหนดประเภทของเสียงที่จะเกิดขึ้น

เครื่องพูดที่ตามมาตลอดศตวรรษที่ 18 และ 19 ยังคงรักษาการตั้งค่านี้แม้ว่าจะมีการปรับปรุงตัวอย่างเช่นในช่วงปลายยุค 1800 โจเซฟเฟอร์สร้างเครื่องพูดที่สามารถรับอินพุตผ่านแป้นพิมพ์และคันเหยียบเครื่องจักรก็มีความคิดสร้างสรรค์มากเช่นกันเมื่อเสียงออกมาผ่าน 'ใบหน้าเทียม' เมื่อศตวรรษที่ 20 มาถึงนวัตกรรมทางอิเล็กทรอนิกส์อนุญาตให้การสังเคราะห์คำพูดมีทิศทางที่ทรงพลังยิ่งขึ้นแม้ว่าสถานที่ตั้งของการเลียนแบบทางเดินเสียงของมนุษย์ยังคงเหมือนเดิมเครื่องจักรที่พูดในช่วงต้นศตวรรษที่ 20 สามารถสร้างเสียงได้ดีขึ้นเนื่องจากการป้อนข้อมูลนั้นแม่นยำยิ่งขึ้นนอกเวทีความบันเทิงนี่เป็นส่วนใหญ่เป็นเพราะ synthesizers คำพูดสามารถเก็บไว้ในซอฟต์แวร์แทนเครื่องแยกต่างหากนอกจากนี้ด้วยคอมพิวเตอร์เป็นตัวช่วยการสังเคราะห์คำพูดอาจใช้ในรูปแบบที่แตกต่างกันการใช้เสียงของมนุษย์เป็นแหล่งหลักสำหรับเสียง

การสังเคราะห์คำพูดในรูปแบบนี้เรียกว่า concatenativeกระบวนการทำงานโดยการเชื่อมต่อการบันทึกเสียงพูดต่าง ๆเสียงที่เกิดขึ้นนั้นเป็นธรรมชาติมากขึ้นและเป็นที่ชื่นชอบของหูสิ่งนี้ตรงกันข้ามกับโปรแกรมที่ใช้การสังเคราะห์ที่เปล่งออกมาซึ่งการพูดซ้ำผ่านรูปแบบคอมพิวเตอร์ของระบบเสียงร้อง

synthesizers คำพูดเชิงพาณิชย์สามารถใช้วิธีการ concatenative หรือ articulatory แต่ทั้งคู่สามารถบรรลุวัตถุประสงค์เดียวกัน;ความสามารถในการให้โอกาสผู้คนได้ยินข้อความสิ่งนี้มีประโยชน์อย่างยิ่งในสถานการณ์ที่การอ่านเป็นไปไม่ได้หรือเป็นไปไม่ได้

ในโลกธุรกิจสถานการณ์ดังกล่าวเป็นเรื่องธรรมดามากโดยเฉพาะอย่างยิ่งสำหรับการทำธุรกรรมทางโทรศัพท์หากไม่มีทางเลือกข้อความเป็นคำพูด (TTS) เจ้าของธุรกิจจะต้องใช้จ่ายเงินจ้างบุคลากรฝ่ายบริการลูกค้ามากขึ้นโซลูชันสังเคราะห์หลีกเลี่ยงปัญหานี้เนื่องจากคอมพิวเตอร์ทำทุกอย่างไม่ใช่มนุษย์

คำพูดสังเคราะห์ยังมีบทบาทในชีวิตประจำวันโดยเฉพาะอย่างยิ่งสำหรับบุคคลที่พิการการพูดคุยนาฬิกาพจนานุกรมและอุปกรณ์อื่น ๆ สามารถทำให้สิ่งต่าง ๆ ง่ายขึ้นสำหรับผู้ที่มีปัญหาในการมองเห็นหรืออ่านคำพูดสังเคราะห์ยังสามารถให้เสียงกับบุคคลที่ไม่สามารถพูดได้เลยSteven Hawking นักฟิสิกส์ที่มีชื่อเสียงเป็นตัวอย่างที่โดดเด่นเนื่องจากโรคของ Lou Gehrig ทำให้เขาปิดเสียงฮอว์คิงใช้เครื่องสังเคราะห์เสียงเพื่อสื่อสารกับผู้คน

นอกจากนี้ยังมีแอปพลิเคชัน TTS เพื่อช่วยเหลือผู้ที่มีกิจกรรมคอมพิวเตอร์ต่างๆเพื่อให้ได้แอพพลิเคชั่นประเภทนี้ผู้ใช้ส่วนใหญ่จะต้องซื้อซอฟต์แวร์แยกต่างหากหรือดาวน์โหลดแพตช์ตัวเลือกหลังมักจะฟรีขึ้นอยู่กับระบบปฏิบัติการหรือโปรแกรมประมวลผลคำที่ใช้อย่างไรก็ตามหากมีคนตัดสินใจES เพื่อซื้อซอฟต์แวร์แยกต่างหากพวกเขาสามารถเข้าถึงระบบที่มีคุณภาพสูงกว่าตัวอย่างที่เฉพาะเจาะจงสามารถมองเห็นได้ผ่าน Natural Reader 7 และข้อความดัง ๆ 2.

ในที่สุดการสังเคราะห์คำพูดคือเทคโนโลยีที่ปฏิวัติวิธีการสื่อสารของมนุษยชาติในแง่หนึ่งมันให้ข้อความชีวิตของตัวเองนอกจากนี้ยังเปิดโอกาสให้โลกได้ยินความคิดของบุคคลที่ยอดเยี่ยมซึ่งปกติจะไม่เป็นเสียง