Skip to main content

Τι είναι η συσχέτιση συσχετισμού;

Η συσχέτιση συσχετισμού πραγματοποιείται σε βάσεις δεδομένων και σε άλλες μεγάλες πηγές δεδομένων για να ομαδοποιήσουν παρόμοια σύνολα δεδομένων, ενώ παράλληλα προειδοποιούν το χρήστη σε διαφορετικά σύνολα δεδομένων.Αυτό μπορεί να γίνει τέλεια σε ορισμένα γραφήματα, ενώ άλλα θα βιώσουν σφάλματα, διότι θα είναι δύσκολο να διαφοροποιηθούν παρόμοια από τα διαφορετικά δεδομένα.Στην περίπτωση του τελευταίου, η συσχέτιση συσχετισμού θα συμβάλει στη μείωση του σφάλματος αυτόματα.Αυτό χρησιμοποιείται συχνά για την εξόρυξη δεδομένων ή για την αναζήτηση δύσκολων δεδομένων για ομοιότητες.Τα ανόμοια δεδομένα διαγράφονται συνήθως ή τοποθετούνται σε ξεχωριστό σύμπλεγμα

Όταν χρησιμοποιείται μια συνάρτηση συσχέτισης συσχέτισης, αναζητά δεδομένα που βασίζονται στις οδηγίες του χρήστη.Ο χρήστης θα πει στο πρόγραμμα τι να αναζητήσει και, όταν βρίσκεται, πού να τοποθετήσετε τα δεδομένα.Αυτό συνήθως εφαρμόζεται σε πολύ μεγάλες πηγές δεδομένων όταν θα ήταν αδύνατο mdash;ή πάρτε πάρα πολλές ώρες mdash;Για να αναζητήσετε τα δεδομένα με μη αυτόματο τρόπο.Μπορεί να υπάρξει τέλειο ομαδοποίηση ή ατελής ομαδοποίηση.

Η τέλεια ομαδοποίηση είναι το ιδανικό σενάριο.Αυτό σημαίνει ότι υπάρχουν μόνο δύο τύποι δεδομένων και το ένα είναι αυτό που ψάχνει ο χρήστης, ενώ ο άλλος δεν είναι απαραίτητος.Όλα τα θετικά ή τα απαραίτητα δεδομένα τοποθετούνται σε ένα σύμπλεγμα, ενώ τα άλλα δεδομένα διαγράφονται ή μετακινούνται.Σε αυτό το σενάριο, δεν υπάρχει σύγχυση και όλα λειτουργούν τέλεια.

Τα πιο πολύπλοκα γραφήματα δεν επιτρέπουν την τέλεια ομαδοποίηση και είναι, αντίθετα, ατελής.Για παράδειγμα, ένα γράφημα έχει τρεις μεταβλητές: x, y και z. x, y είναι παρόμοια, το x, z είναι παρόμοια, αλλά y, z είναι ανόμοιο.Οι τρεις μεταβλητές συστάδες είναι τόσο παρόμοιες, ωστόσο, είναι αδύνατο να έχουμε τέλεια συσχέτιση συσχέτισης.Το πρόγραμμα θα λειτουργήσει για να μεγιστοποιήσει τον αριθμό των θετικών συσχετισμών, αλλά αυτό θα απαιτήσει ακόμη κάποια χειροκίνητη αναζήτηση από τον χρήστη.Για παράδειγμα, εάν μια επιχείρηση εξορύσσεται δεδομένα για έναν μεγάλο ιστότοπο ή βάση δεδομένων και θέλει μόνο να μάθει για μια συγκεκριμένη πτυχή, θα χρειαζόταν για πάντα να αναζητήσουμε όλα τα δεδομένα για αυτή την πτυχή.Χρησιμοποιώντας μια φόρμουλα συσσωμάτωσης, τα δεδομένα θα τεθούν κατά μέρος για σωστή ανάλυση.Ο χρήστης μπορεί να επιλέξει να στείλει διαφορετικά δεδομένα σε διαφορετικές συστάδες, επειδή οι πληροφορίες μπορεί να είναι χρήσιμες για άλλα έργα.Εάν τα δεδομένα δεν είναι απαραίτητα και απλά σπαταλούν τη μνήμη, τότε οι ανόμοιες πληροφορίες απορρίπτονται.Στην ατελής ομαδοποίηση, είναι πιθανό ότι ορισμένες ανόμοιες πληροφορίες δεν θα πεταχτούν, επειδή είναι τόσο παρόμοια με τα δεδομένα για τα οποία αναζητά ο χρήστης.