Skip to main content

Τι είναι η ταξινόμηση εξόρυξης δεδομένων;

Η ταξινόμηση εξόρυξης δεδομένων είναι ένα βήμα στη διαδικασία εξόρυξης δεδομένων.Χρησιμοποιείται για την ομαδοποίηση αντικειμένων με βάση ορισμένα βασικά χαρακτηριστικά.Υπάρχουν αρκετές τεχνικές που χρησιμοποιούνται για την ταξινόμηση των εξόρυξης δεδομένων, συμπεριλαμβανομένης της πλησιέστερης ταξινόμησης των γειτονικών, της εκμάθησης δέντρων αποφάσεων και των μηχανών διανυσμάτων υποστήριξης.

Η εξόρυξη δεδομένων είναι μια μέθοδος που χρησιμοποιούν οι ερευνητές για την εξαγωγή μοτίβων από δεδομένα.Γενικά, ένα αντιπροσωπευτικό δείγμα επιλέγεται από την ομάδα δεδομένων και στη συνέχεια χειρίζεται και αναλύεται για να βρει πρότυπα.Εκτός από την ταξινόμηση εξόρυξης δεδομένων, οι ερευνητές μπορούν επίσης να χρησιμοποιούν την ομαδοποίηση, την παλινδρόμηση και την εκμάθηση κανόνα για την ανάλυση των δεδομένων.Η πλησιέστερη ταξινόμηση γειτονικών είναι ένας από τους απλούστερους αλγόριθμους ταξινόμησης εξόρυξης δεδομένων.Βασίζεται σε ένα σετ κατάρτισης.Ένα σετ κατάρτισης είναι ένα σύνολο δεδομένων που χρησιμοποιούνται για την εκπαίδευση του υπολογιστή για να δώσουν προσοχή σε ορισμένες μεταβλητές.Στην πλησιέστερη ταξινόμηση των γειτονικών, ο υπολογιστής απλώς ταξινομεί όλα τα δεδομένα ως μέρος της ομάδας που περιέχει δεδομένα πλησιέστερα στην αξία στην είσοδο.

Η εκμάθηση δέντρων αποφάσεων χρησιμοποιεί ένα μοντέλο διακλάδωσης για την ταξινόμηση των δεδομένων.Ο υπολογιστής βασικά θέτει μια σειρά ερωτήσεων σχετικά με τα δεδομένα.Εάν η απάντηση στην πρώτη ερώτηση είναι αληθής, ρωτάει την ερώτηση 2Α.Εάν η απάντηση είναι ψευδής, θέτει την ερώτηση 2Β.Ζητά μια σειρά ερωτήσεων σχετικά με κάθε κομμάτι δεδομένων και στη συνέχεια χρησιμοποιεί τις απαντήσεις για να καθορίσει την πιθανότητα ότι τα δεδομένα ανήκουν σε μια συγκεκριμένη ταξινόμηση.Αυτό είναι διαφορετικό από τη μάθηση δέντρων αποφάσεων, επειδή η απάντηση στο πρώτο ερώτημα δεν επηρεάζει ποια ερώτηση θα τεθεί στη συνέχεια.Αυτές οι μέθοδοι είναι μοντέλα που βασίζονται σε υπολογιστές που θα ήταν δύσκολο να γίνουν με το χέρι.Τα νευρωνικά δίκτυα χρησιμοποιούνται συχνά στον προγραμματισμό τεχνητής νοημοσύνης επειδή μιμείται τον ανθρώπινο εγκέφαλο.Φιλτράρει πληροφορίες μέσω μιας σειράς κόμβων που βρίσκουν μοτίβα και στη συνέχεια ταξινομούν τις πληροφορίες.

Οι μηχανές διάνυσμα υποστήριξης χρησιμοποιούν δείγματα κατάρτισης για να δημιουργήσουν ένα μοντέλο που θα ταξινομήσει τις πληροφορίες, συνήθως απεικονίζεται ως οικόπεδο διασποράς με ευρύ χώρο μεταξύ των κατηγοριών.Όταν τροφοδοτούνται νέες πληροφορίες στο μηχάνημα, σχεδιάζεται στο γράφημα.Τα δεδομένα στη συνέχεια ταξινομούνται βάσει της κατηγορίας που οι πληροφορίες πέφτουν πλησιέστερα στο γράφημα.Αυτή η μέθοδος λειτουργεί μόνο όταν υπάρχουν δύο επιλογές για να διαλέξετε.