Skip to main content

Τι είναι τα εργαλεία εξόρυξης δεδομένων;

Τα εργαλεία εξόρυξης δεδομένων είναι εξαρτήματα λογισμικού και θεωρίες που επιτρέπουν στους χρήστες να εξάγουν πληροφορίες από δεδομένα.Τα εργαλεία παρέχουν σε άτομα και εταιρείες τη δυνατότητα να συλλέγουν μεγάλα ποσά δεδομένων και να τα χρησιμοποιούν για να κάνουν προσδιορισμούς σχετικά με έναν συγκεκριμένο χρήστη ή ομάδες χρηστών.Ορισμένες από τις πιο συνηθισμένες χρήσεις των εργαλείων εξόρυξης δεδομένων βρίσκονται στους τομείς της μάρκετινγκ, της προστασίας της απάτης και της επιτήρησης.

Η χειροκίνητη εξαγωγή δεδομένων υπήρξε για εκατοντάδες χρόνια.Ωστόσο, η αυτοματοποίηση της εξόρυξης δεδομένων ήταν πιο διαδεδομένη από την αυγή της εποχής του υπολογιστή.Κατά τη διάρκεια του 20ου αιώνα, προέκυψαν διάφορες επιστήμες υπολογιστών για να βοηθήσουν στην υποστήριξη της έννοιας της ανάπτυξης εργαλείων εξόρυξης δεδομένων.Ο συνολικός στόχος της χρήσης των εργαλείων είναι η αποκάλυψη κρυφών μοτίβων.Για παράδειγμα, εάν μια εταιρεία μάρκετινγκ διαπιστώσει ότι ένα άτομο παίρνει ένα μηνιαίο ταξίδι από τη Νέα Υόρκη στο Λος Άντζελες, γίνεται ευεργετικό για την εν λόγω εταιρεία να διαφημίζει λεπτομέρειες του προορισμού στο άτομο.

Στο πλαίσιο της βιομηχανίας εξόρυξης δεδομένων, έχουν δημιουργηθεί πρότυπα για τον καθορισμό των παραμέτρων της χρήσης εργαλείων εξόρυξης δεδομένων.Ετησίως, η Ένωση για την Ομάδα Ειδικών Ενδιαφέροντος της Ένωσης Υπολογισμών για την Ανακάλυψη Γνώσης και την Εξόρυξη Δεδομένων (SIGKDD) πραγματοποιεί μια συνάντηση για να καθορίσει ποιες διαδικασίες χρησιμοποιούνται.Η ίδια ομάδα είναι επίσης υπεύθυνη για την αξιολόγηση των δεοντολογικών επιπτώσεων της ανάλυσης δεδομένων από άτομα και εταιρείες.Ένα εξαμηνιαίο περιοδικό δημοσιεύεται από την ομάδα με τίτλο Sigkdd Explorations.

Το πιο διαδεδομένο εργαλείο που χρησιμοποιείται στην εξόρυξη δεδομένων είναι η διαδικασία που ονομάζεται Discovery Knowledge σε βάσεις δεδομένων (KDD).Το KDD αναπτύχθηκε το 1989 από τον Gregory Piatetsky-Shapiro.Χρησιμοποιώντας αυτό το εργαλείο εξόρυξης δεδομένων, οι χρήστες είναι σε θέση να επεξεργάζονται ακατέργαστα δεδομένα, να εξελίξουν τα δεδομένα για πληροφορίες και να ερμηνεύουν τα διάφορα αποτελέσματα με τη μορφή διαχείρισης πληροφοριών.

Μία από τις πιο σημαντικές μορφές εργαλείων εξόρυξης δεδομένων χρησιμοποιείται για την καταπολέμηση της τρομοκρατίας στον 21ο αιώνα.Στις Ηνωμένες Πολιτείες, το Εθνικό Συμβούλιο Έρευνας χρησιμοποιεί τις έννοιες της εξόρυξης προτύπων και της εξόρυξης δεδομένων που βασίζεται σε θέματα για τον εντοπισμό της τρομοκρατικής δραστηριότητας στη μεγάλη ομάδα πληροφοριών σε όλο τον κόσμο.Η εξόρυξη προτύπων ορίζεται από τη διαδικασία εντοπισμού μοτίβων σε μεγάλο όγκο δεδομένων.Οι προσπάθειες εξόρυξης δεδομένων που βασίζονται σε θέματα για τον εντοπισμό σχέσεων μεταξύ ατόμων.Και οι δύο τεχνικές μπορούν επίσης να χρησιμοποιηθούν στη γενική επιχειρηματική πρακτική καθορίζοντας τη νοοτροπία μιας πελατειακής βάσης και τη διαδραστική σχέση μεταξύ των πελατών.