Skip to main content

Τι είναι τα βρώμικα δεδομένα;

Dirty Data είναι ένας όρος που χρησιμοποιείται για να περιγράψει οποιοδήποτε τύπο ηλεκτρονικών δεδομένων που είναι ξεπερασμένο, ελλιπές ή με άλλο τρόπο δεν είναι ακριβείς.Τα δεδομένα αυτού του τύπου μπορούν να δημιουργηθούν λόγω σφαλμάτων στην καταχώρηση δεδομένων, η αποτυχία να ενημερωθούν τα δεδομένα σε τακτική βάση ή ακόμα και στην είσοδο των ίδιων δεδομένων περισσότερες από μία φορές.Κατά καιρούς, τα λανθασμένα δεδομένα δεν είναι τίποτα περισσότερο από σφάλματα στη στίξη στο κείμενο των ηλεκτρονικών εγγράφων.Σε άλλες περιπτώσεις, τα βρώμικα δεδομένα μπορεί να είναι πληροφορίες που είναι σκόπιμα παραπλανητικές, όπως οι προσπάθειες τροποποίησης των λογιστικών αρχείων για να παρουσιάσουν μια συγκεκριμένη εικόνα στους επενδυτές και σε άλλους.

Ως επί το πλείστον, η συσσώρευση βρώμικων δεδομένων σε οποιοδήποτε τύπο βάσης δεδομένων είναι ακούσια.Τα άτομα που εισέρχονται σε νέες πληροφορίες στη βάση δεδομένων ενδέχεται να ορθογραφούν λόγια, να αφήσουν τη στίξη που είναι σημαντική για την κατανόηση της πρόθεσης του κειμένου ή να μην ακολουθήσουν μια συγκεκριμένη στρατηγική μορφοποίησης.Με καταστάσεις αυτού του τύπου, η διόρθωση των λανθασμένων πληροφοριών είναι μια σχετικά απλή διαδικασία που δεν απαιτεί τίποτα περισσότερο από την αλλαγή του λανθασμένου κειμένου και την εξοικονόμηση των αλλαγών.Οι επιχειρήσεις διαχειρίζονται μερικές φορές αυτή τη διαδικασία με τη διόρθωση δεδομένων μετά την εισαγωγή τους και την πραγματοποίηση των απαραίτητων ενημερώσεων.

Τα βρώμικα δεδομένα ενδέχεται επίσης να προκύψουν λόγω της αποτυχίας της ενημέρωσης των υφιστάμενων αρχείων όταν αλλάζουν οι πληροφορίες.Για παράδειγμα, εάν οι πωλητές αποτύχουν να ενημερώσουν τα αρχεία πελατών όταν εμφανίζονται αλλαγές προσωπικού με έναν συγκεκριμένο πελάτη, αυτά τα αρχεία δεν είναι πλέον ακριβή και θεωρούνται βρώμικα.Όπως συμβαίνει με τη διόρθωση σφαλμάτων ορθογραφίας και στίξης, λαμβάνοντας το χρόνο για να καταργήσετε τις ξεπερασμένες πληροφορίες και να τα αντικαταστήσετε με τα τρέχοντα δεδομένα βοηθά στην αύξηση της συνολικής χρηστικότητας της βάσης δεδομένων.

Υπάρχουν καταστάσεις όπου η δημιουργία βρώμικων δεδομένων είναι σκόπιμη.Οι εταιρείες μπορούν να επιλέξουν να παραλείψουν συγκεκριμένες πληροφορίες από μια βάση δεδομένων προκειμένου να δημιουργήσουν μια συγκεκριμένη αντίληψη σχετικά με τα οικονομικά, όπως η επισήμανση του ποσού των παραγόμενων εσόδων για μια δεδομένη περίοδο, αλλά η επιλογή να μην εισαγάγετε δεδομένα που σχετίζονται με το ποσό των εισοδημάτων που συλλέγονται για το ίδιοπερίοδος.Σε αυτόν τον τύπο βρώμικων δεδομένων, οι πληροφορίες που παρουσιάζονται είναι ακριβείς στο μέτρο του δυνατού, αλλά θεωρούνται ελλιπείς.

Με ορισμένους τύπους βρώμικων δεδομένων, η απόφαση μπορεί να είναι να μην πάρει το χρόνο και την προσπάθεια για τη διόρθωση.Αυτό είναι κοινό όταν τα λανθασμένα δεδομένα δεν έχουν καμία επίδραση στην ικανότητα της επιχείρησης να λειτουργεί σωστά ή δεν παρουσιάζει καμία πιθανότητα να προκαλέσει μεγάλη δυσφορία.Αυτό σημαίνει ότι σχεδόν οποιαδήποτε οντότητα που διατηρεί κάποιο είδος βάσης δεδομένων πιθανότατα έχει τουλάχιστον λίγα βρώμικα δεδομένα διασκορπισμένα με άλλες πληροφορίες που είναι τρέχουσες και ακριβείς.