Skip to main content

Word Sense Disambiguation คืออะไร?

Word Sense Disambiguation (WSD) อยู่ที่แกนหลักของโปรแกรมซอฟต์แวร์ที่ออกแบบมาเพื่อตีความภาษาคำหรือประโยคที่คลุมเครือสามารถเข้าใจได้หลายวิธีแม้ว่าจะมีความหมายเพียงอย่างเดียวเท่านั้น DIS Ambiguation พยายามที่จะถอดรหัสความหมายที่ตั้งใจไว้ของคำและประโยคพื้นที่นี้มีความท้าทายอย่างยิ่งสำหรับโปรแกรมเมอร์ที่ได้รับมอบหมายให้ออกแบบอินเทอร์เฟซที่ถูกต้องเพื่อเชื่อมช่องว่างระหว่างภาษาพูดและภาษาเขียนและการแปลที่สร้างคอมพิวเตอร์

ซอฟต์แวร์ที่ออกแบบมาเพื่อแปลงคำพูดเป็นข้อความสามารถ "ฟัง" กับผู้ใช้ที่พูดลงในไมโครโฟนและแปลคำพูดเป็นประโยคที่พิมพ์ผู้ใช้กำหนดเครื่องหมายวรรคตอนการแทรกคำเช่น "เครื่องหมายจุลภาค" และ "ระยะเวลา" ตามความเหมาะสมฟังดูค่อนข้างตรงไปตรงมายกเว้นว่ามีหลายคำที่ฟังดูเหมือนกัน

ตัวอย่างเช่นรู้และไม่หรือ i และตาไม่สามารถแยกออกได้คำศัพท์ที่ไม่น่าเชื่อช่วยในการแปล“ ฉันควรรู้ในสัปดาห์หน้า” อย่างถูกต้องโดยใช้สิ่งที่เป็นชุดของกฎ“ ถ้า” ที่ใช้การวางคำและคำที่อยู่ติดกันเป็นตัวบ่งชี้ของคำที่ตั้งใจไว้ความรู้สึกไม่ดีของคำนี้เป็นที่รู้จักกันในชื่อ "วิธีตื้น" และมีความแม่นยำพอสมควร แต่ไม่สามารถนับได้เสมอ

อีกวิธีหนึ่งคือการใช้“ ความรู้ระดับโลก” หรือภาษาศาสตร์คอมพิวเตอร์ที่เรียกว่า“ แนวทางลึก”วิธีการนี้ขึ้นอยู่กับพจนานุกรมเช่นพจนานุกรมและอรรถาภิธานเพื่อช่วยกำหนดความรู้สึกที่เหมาะสมของคำน่าเสียดายที่การออกแบบฐานข้อมูลแนวทางลึกที่ครอบคลุมเพียงพอที่จะให้ความแม่นยำที่ดีกว่าวิธีตื้นไม่ใช่เรื่องง่าย

ซอฟต์แวร์ที่อ่านข้อความดัง ๆยกตัวอย่างเช่นคำ

เบสอาจหมายถึงเครื่องดนตรีโน้ตหรือปลาในกรณีหลังมันออกเสียงแตกต่างกันปล่อยให้ WSD เพื่อสรุปว่าการออกเสียงที่จะใช้หากประโยคที่พิมพ์ออกมาเป็น“ เสียงเบสนั้นหนัก” มีเพียงการสแกนประโยคโดยรอบเท่านั้นที่อาจเปิดเผยเบาะแสเช่นการค้นหาคำว่า“ ตกปลา”“ เรือ”“ ท่าเรือ” หรือในทางกลับกัน“ วงดนตรี””เพลง” หรือ“ เพลง”หากคำศัพท์ของโปรแกรม disambiguation ไม่แข็งแรงพอหรือหากขาดเบาะแสเพิ่มเติมโปรแกรมสามารถทำให้เกิดข้อผิดพลาดในการแปล

นอกเหนือจากกฎ“ ถ้า” ของวิธีการตื้นแล้วอัลกอริทึมยังใช้เพื่อกำหนดการตีความที่ถูกต้องในตัวอย่างข้างต้นอัลกอริทึมอาจพบคำสำคัญตลอดทั้งเอกสารที่ชี้ไปที่การตีความทางดนตรีอย่างชัดเจนหรือวีซ่าในทางกลับกันวิธีการอื่น ๆ ยังใช้ใน WSD ที่มีการปรับแต่งหรือส่วนขยายของวิธีการพื้นฐานเหล่านี้โดยทั่วไป

ความรู้สึก disambiguation คำมีความสำคัญในอินเทอร์เฟซคำสั่งทางวาจาที่ออกแบบมาเพื่อแทนที่แป้นพิมพ์ mDash;ไม่เพียง แต่ในการถ่ายทอดคำสั่งระบบปฏิบัติการอย่างง่าย แต่ในงานที่ซับซ้อนเช่นการค้นคว้าเว็บพื้นที่อื่น ๆ ที่ WSD มีบทบาท ได้แก่ การพัฒนาเว็บความหมายและการปรับปรุงโมเดลปัญญาประดิษฐ์อันที่จริงแล้วสาขาวิทยาศาสตร์ใด ๆ ที่ต้องอาศัยสะพานทางภาษาระหว่างมนุษย์และเครื่องจักรจะใช้คำศัพท์ที่ไม่น่าเชื่อ