Skip to main content

การเชื่อมต่อระหว่างการสังเคราะห์คำพูดและการรับรู้คืออะไร?

การสังเคราะห์เสียงพูดและการรับรู้เป็นสองด้านของการวิเคราะห์คำพูดด้วยคอมพิวเตอร์การสังเคราะห์คำพูดคือการสร้างคำพูดของมนุษย์โดยคอมพิวเตอร์ตัวอย่างเช่นคอมพิวเตอร์ที่อ่านข้อความที่เขียนการรู้จำเสียงพูดคือการสร้างข้อมูลคอมพิวเตอร์จากคำพูดเช่นการกำหนดกระดาษให้กับคอมพิวเตอร์ในขณะที่กระบวนการทั้งสองไม่เกี่ยวข้องโดยตรงการสังเคราะห์เสียงพูดและการรับรู้ทั้งสองขึ้นอยู่กับความสามารถของคอมพิวเตอร์ในการเข้าใจคำพูดและการผันของมนุษย์วิธีหนึ่งคือเอาต์พุตและอีกวิธีหนึ่งคืออินพุต

กระบวนการที่ใช้โดยการสังเคราะห์คำพูดและการรับรู้นั้นคล้ายกันมากแม้ว่าผลิตภัณฑ์สุดท้ายจะแตกต่างกันกระบวนการประกอบด้วยสองส่วนส่วนหนึ่งที่มีปฏิสัมพันธ์ของมนุษย์และอีกส่วนหนึ่งโดยไม่ต้องส่วนของมนุษย์คือเมื่อคำพูดของมนุษย์เข้าสู่โปรแกรม;ส่วนที่ไม่ใช่มนุษย์คือเมื่อโปรแกรมเชื่อมต่ออินพุต

โปรแกรมการสังเคราะห์คำพูดจะใช้ในการป้อนข้อมูลของมนุษย์ในรูปแบบหรือภาษามนุษย์พิมพ์หรือเขียนเป็นลายลักษณ์อักษรโปรแกรมจะอ่านภาษาและกำหนดว่าแต่ละคำแต่ละคำโดยใช้ตำแหน่งประโยคและเครื่องหมายวรรคตอนเพื่อพิจารณาการผันเมื่อคำสามารถออกเสียงได้หลายวิธีเช่นในกรณีของ 'Live' โปรแกรมจะมองหาคำและเบาะแสบริบทใกล้เคียงเพื่อกำหนดคำที่ใช้จริงคำพูดจะไปที่ส่วนที่สองของโปรแกรมที่พวกเขาพูดออกมาดัง ๆ

ในโปรแกรมการรู้จำเสียงพูดกระบวนการตรงข้ามอินพุตมาจากลำโพงของมนุษย์ที่พูดคำลงในคอมพิวเตอร์คอมพิวเตอร์จะฟังแต่ละคำและเปรียบเทียบรูปแบบที่สร้างโดยเสียงของผู้พูดกับไลบรารีที่มีเสียงและคำพูดที่เป็นไปได้จากนั้นจะทำการพิจารณาคำที่เป็นไปได้มากที่สุดและส่งไปยังส่วนที่สองของระบบส่วนนี้พิมพ์คำบนหน้าจอจริง ๆ คล้ายกับวิธีที่โปรแกรมการสังเคราะห์พูดคำเนื่องจากผู้พูดทุกคนฟังดูแตกต่างกันเล็กน้อยการสังเคราะห์เสียงพูดและโปรแกรมการรับรู้มักจะมีข้อผิดพลาดที่กว้างหนึ่งในวิธีที่ผู้คนต่อสู้กับข้อผิดพลาดเหล่านี้คือผ่านโปรไฟล์การพูดเป็นรายบุคคลผู้พูดคนเดียวจะมีการวิเคราะห์คำพูดของเขาโดยโปรแกรมเพื่อค้นหารูปแบบเสียงร้องเฉพาะของเขาเมื่อเขาพบข้อผิดพลาดในการแปลคอมพิวเตอร์เขาสามารถแก้ไขได้โดยเฉพาะการแก้ไขจะถูกวิเคราะห์และจัดเก็บโดยโปรแกรมดังนั้นเมื่อคำที่ลำบากเกิดขึ้นอีกครั้งโปรแกรมจะแปลได้อย่างถูกต้องมีแอปพลิเคชันที่หลากหลายสำหรับการสังเคราะห์เสียงพูดและโปรแกรมการรับรู้ในสาขาการแพทย์โปรแกรมเหล่านี้อนุญาตให้ผู้คนสื่อสารว่าใครเป็นอย่างอื่นอาจไม่สามารถทำได้โปรแกรมเหล่านี้มีแอพพลิเคชั่นที่หลากหลายในธุรกิจเป็นวิธีการแปลรายงานและเอกสารที่เร็วกว่าการรู้จำเสียงพูดยังเป็นวิธีการทั่วไปในการตั้งค่าอุปกรณ์แฮนด์ฟรีในรถยนต์ทำให้ผู้คนสามารถพูดคุยทางโทรศัพท์ได้อย่างปลอดภัยยิ่งขึ้นขณะขับรถ