Skip to main content

การจำแนกการขุดข้อมูลคืออะไร?

การจำแนกการขุดข้อมูลเป็นขั้นตอนเดียวในกระบวนการขุดข้อมูลมันถูกใช้ในการจัดกลุ่มรายการตามลักษณะสำคัญบางอย่างมีหลายเทคนิคที่ใช้สำหรับการจำแนกประเภทการขุดข้อมูลรวมถึงการจำแนกเพื่อนบ้านที่ใกล้ที่สุดการเรียนรู้ต้นไม้การตัดสินใจและสนับสนุนเครื่องเวกเตอร์

การขุดข้อมูลเป็นวิธีการที่นักวิจัยใช้ในการแยกรูปแบบจากข้อมูลโดยทั่วไปตัวอย่างตัวแทนจะถูกเลือกจากกลุ่มข้อมูลจากนั้นจัดการและวิเคราะห์เพื่อค้นหารูปแบบนอกเหนือจากการจำแนกประเภทการขุดข้อมูลนักวิจัยอาจใช้การจัดกลุ่มการถดถอยและการเรียนรู้กฎเพื่อวิเคราะห์ข้อมูล

มีอัลกอริทึมหลายอย่างที่สามารถใช้ในการจำแนกการขุดข้อมูลการจำแนกประเภทเพื่อนบ้านที่ใกล้ที่สุดเป็นหนึ่งในอัลกอริทึมการจำแนกประเภทการขุดข้อมูลที่ง่ายที่สุดมันขึ้นอยู่กับชุดการฝึกอบรมชุดการฝึกอบรมคือชุดข้อมูลที่ใช้ในการฝึกอบรมคอมพิวเตอร์ให้ใส่ใจกับตัวแปรบางตัวในการจำแนกประเภทเพื่อนบ้านที่ใกล้ที่สุดคอมพิวเตอร์จะจำแนกข้อมูลทั้งหมดเป็นส่วนหนึ่งของกลุ่มที่มีข้อมูลที่ใกล้เคียงที่สุดกับอินพุต

การเรียนรู้แผนผังการเรียนรู้ใช้รูปแบบการแตกแขนงเพื่อจำแนกข้อมูลคอมพิวเตอร์โดยทั่วไปจะถามคำถามเกี่ยวกับข้อมูลหากคำตอบสำหรับคำถามแรกเป็นจริงมันจะถามคำถาม 2Aหากคำตอบเป็นเท็จมันจะถามคำถาม 2bเมื่อดึงออกมาวิธีนี้จะเป็นต้นไม้ของเส้นทางการแตกแขนง

การจำแนกประเภทที่ไร้เดียงสาเบย์ขึ้นอยู่กับความน่าจะเป็นมันถามคำถามเกี่ยวกับข้อมูลแต่ละชิ้นแล้วใช้คำตอบเพื่อกำหนดความน่าจะเป็นที่ข้อมูลอยู่ในการจำแนกประเภทเฉพาะสิ่งนี้แตกต่างจากการเรียนรู้ของต้นไม้การตัดสินใจเพราะคำตอบสำหรับคำถามแรกไม่ได้มีอิทธิพลต่อคำถามที่จะถามต่อไป

วิธีการจำแนกประเภทการขุดข้อมูลที่ซับซ้อนมากขึ้นรวมถึงเครือข่ายประสาทและเครื่องเวกเตอร์สนับสนุนวิธีการเหล่านี้เป็นรุ่นคอมพิวเตอร์ที่ใช้มือยากเครือข่ายประสาทมักใช้ในการเขียนโปรแกรมปัญญาประดิษฐ์เพราะมันเลียนแบบสมองมนุษย์มันกรองข้อมูลผ่านชุดของโหนดที่ค้นหารูปแบบแล้วจำแนกข้อมูล

การสนับสนุนเครื่องเวกเตอร์ใช้ตัวอย่างการฝึกอบรมเพื่อสร้างแบบจำลองที่จะจำแนกข้อมูลซึ่งมักจะมองเห็นเป็นพล็อตกระจายที่มีพื้นที่กว้างระหว่างหมวดหมู่เมื่อข้อมูลใหม่ถูกป้อนเข้าสู่เครื่องมันจะถูกพล็อตบนกราฟข้อมูลจะถูกจัดประเภทตามหมวดหมู่ข้อมูลที่อยู่ใกล้กับกราฟมากที่สุดวิธีนี้ใช้งานได้เฉพาะเมื่อมีสองตัวเลือกให้เลือก