Skip to main content

Τι είναι η εξόρυξη δεδομένων;

Η εξόρυξη δεδομένων χρησιμοποιεί μια σχετικά μεγάλη ποσότητα υπολογιστικής ισχύος που λειτουργεί σε ένα μεγάλο σύνολο δεδομένων για τον προσδιορισμό των κανονικότητας και των συνδέσεων μεταξύ των σημείων δεδομένων.Οι αλγόριθμοι που χρησιμοποιούν τεχνικές από στατιστικές, μηχανική μάθηση και αναγνώριση προτύπων χρησιμοποιούνται για την αυτόματη αναζήτηση μεγάλων βάσεων δεδομένων.Η εξόρυξη δεδομένων είναι επίσης γνωστή ως ανακάλυψη γνώσης στις βάσεις δεδομένων (KDD)

Όπως ο όρος Τεχνητή νοημοσύνη , η εξόρυξη δεδομένων είναι ένας όρος ομπρέλα που μπορεί να εφαρμοστεί σε διάφορες ποικίλες δραστηριότητες.Στον εταιρικό κόσμο, η εξόρυξη δεδομένων χρησιμοποιείται συχνότερα για τον προσδιορισμό της κατεύθυνσης των τάσεων και την πρόβλεψη του μέλλοντος.Χρησιμοποιείται για την κατασκευή μοντέλων και συστημάτων υποστήριξης αποφάσεων που δίνουν στους ανθρώπους πληροφορίες που μπορούν να χρησιμοποιήσουν.Η εξόρυξη δεδομένων παίρνει έναν ρόλο πρώτης γραμμής στη μάχη κατά της τρομοκρατίας.Υποτίθεται ότι χρησιμοποιήθηκε για τον προσδιορισμό του ηγέτη των επιθέσεων της 11ης Σεπτεμβρίου.

Οι ανθρακωρύχοι δεδομένων είναι στατιστικολόγοι που χρησιμοποιούν τεχνικές με ονόματα όπως Μοντέλα κοντά στο γείτονα , k-means ομαδοποίηση , Μέθοδος αναμονής , k-foldΔιασταυρούμενη επικύρωση , η μέθοδος

Οι τεχνικές παλινδρόμησης χρησιμοποιούνται για την αφαίρεση άσχετων μοτίβων, αφήνοντας μόνο χρήσιμες πληροφορίες.Ο όρος Bayesian παρατηρείται συχνά στον τομέα, αναφερόμενος σε μια κατηγορία τεχνικών συμπερασμάτων που προβλέπουν την πιθανότητα μελλοντικών γεγονότων συνδυάζοντας προηγούμενες πιθανότητες και πιθανότητες που βασίζονται σε συμβάντα υπό όρους.Το φιλτράρισμα ανεπιθύμητης αλληλογραφίας είναι αναμφισβήτητα μια μορφή εξόρυξης δεδομένων, η οποία φέρνει αυτόματα τα σχετικά μηνύματα στην επιφάνεια από μια χαοτική θάλασσα των προσπαθειών ηλεκτρονικού "ψαρέματος" και των γήπεδων viagra.Σε ένα δέντρο αποφάσεων, όλα τα δεδομένα περνούν μέσω ενός κόμβου εισόδου, όπου αντιμετωπίζει ένα φίλτρο που χωρίζει τα δεδομένα σε ρεύματα ανάλογα με τα χαρακτηριστικά του.Για παράδειγμα, τα δεδομένα σχετικά με τη συμπεριφορά των καταναλωτών είναι πιθανό να φιλτραριστούν με βάση τους δημογραφικούς παράγοντες.Η εξόρυξη δεδομένων δεν αφορά κυρίως τις φανταχτερά γραφήματα και τις τεχνικές απεικόνισης, αλλά τις χρησιμοποιεί για να δείξει τι έχει βρει.Είναι γνωστό ότι μπορούμε να απορροφήσουμε περισσότερες στατιστικές πληροφορίες οπτικά από ό, τι προφορικά και αυτή η μορφή για παρουσίαση μπορεί να είναι πολύ πειστική και ισχυρή εάν χρησιμοποιείται στο σωστό πλαίσιο. "Καθώς ο πολιτισμός μας γίνεται όλο και περισσότερο κορεσμένος με δεδομένα και οι αισθητήρες διανέμονται μαζικά στην τοπική μαςπεριβάλλοντα, θα ανακαλύψουμε ακούσια πράγματα που θα μπορούσαν να χάσουν το πρώτο πέρασμα.Η εξόρυξη δεδομένων θα μας επιτρέψει να διορθώσουμε αυτά τα λάθη και να ανακαλύψουμε νέες ιδέες με βάση τα προηγούμενα δεδομένα, δίνοντάς μας περισσότερη έκρηξη για το Buck Storage Data.