Skip to main content

Was sind schmutzige Daten?

Dirty Data ist ein Begriff, mit dem alle Arten von elektronischen Daten beschrieben werden, die veraltet, unvollständig oder auf andere Weise nicht genau sind.Daten dieses Typs können aufgrund von Fehlern in der Dateneingabe, eines regelmäßigen Aktens der Daten oder sogar der Eingabe derselben Daten mehr als einmal erstellt werden.Manchmal sind die falschen Daten nichts anderes als Fehler in der Interpunktion im Text elektronischer Dokumente.In anderen Fällen können schmutzige Daten Informationen sein, die absichtlich irreführend sind, z.

Zum größten Teil ist die Akkumulation von schmutzigen Daten in jeder Art von Datenbank unbeabsichtigt.Personen, die neue Informationen in die Datenbank eingeben, können Wörter falsch geschrieben, Interpunktion auslassen, die für das Verständnis der Absicht des Textes wichtig sind oder einer bestimmten Formatierungsstrategie nicht folgen.Bei Situationen dieses Typs ist die Korrektur der falschen Informationen ein relativ einfacher Prozess, der nichts anderes erfordert, als den falschen Text zu ändern und die Änderungen zu speichern.Unternehmen verwalten diesen Prozess manchmal, indem sie Daten nach der Eingabe von Daten ordnen und die erforderlichen Aktualisierungen erstellen.

schmutzige Daten können auch auftreten, da vorhandene Datensätze bei Änderungen der Informationen nicht aktualisiert werden können.Wenn Verkäufer beispielsweise keine Kundendateien aktualisieren, wenn Personaländerungen bei einem bestimmten Kunden auftreten, sind diese Dateien nicht mehr korrekt und werden als schmutzig angesehen.Wie bei der Korrektur von Rechtschreib- und Interpunktionsfehlern trägt die Zeit, veraltete Informationen zu entfernen und durch aktuelle Daten zu ersetzen, die Gesamtnutzbarkeit der Datenbank zu erhöhen.

Es gibt Situationen, in denen die Schaffung schmutziger Daten beabsichtigt ist.Unternehmen können sich dafür entscheiden, bestimmte Informationen aus einer Datenbank auszulassen, um eine spezifische Wahrnehmung in Bezug auf Finanzen zu erstellen, z.Zeitraum.In dieser Art von schmutzigen Daten sind die vorgestellten Informationen so weit wie möglich genau, werden aber als unvollständig angesehen.

Mit einigen Arten von schmutzigen Daten kann die Entscheidung darin bestehen, sich nicht die Zeit und Mühe zu nehmen, um Korrekturen vorzunehmen.Dies ist üblich, wenn die falschen Daten keinen Einfluss auf die Fähigkeit des Unternehmens haben, ordnungsgemäß zu funktionieren, oder kein Potenzial für eine große Belastung darstellt.Dies bedeutet, dass nahezu jedes Unternehmen, das eine Art Datenbank verwaltet, wahrscheinlich mindestens ein wenig schmutzige Daten hat, die mit anderen Informationen durchsetzt sind, die aktuell und genau sind.