Was sind schmutzige Daten?

Dirty Data ist ein Begriff, mit dem alle Art von elektronischen Daten beschrieben werden, die veraltet, unvollständig oder auf andere Weise nicht genau sind. Daten dieses Typs können aufgrund von Fehlern in der Dateneingabe, eines regelmäßigen Aktens der Daten oder sogar der Eingabe derselben Daten mehr als einmal erstellt werden. Manchmal sind die falschen Daten nichts anderes als Fehler in der Interpunktion im Text elektronischer Dokumente. In anderen Fällen können schmutzige Daten Informationen sein, die absichtlich irreführend sind, z.

größtenteils ist die Akkumulation von schmutzigen Daten in jeder Art von Datenbank unbeabsichtigt. Personen, die neue Informationen in die Datenbank eingeben, können Wörter falsch geschrieben, Interpunktion auslassen, die für das Verständnis der Absicht des Textes wichtig sind oder einer bestimmten Formatierungsstrategie nicht folgen. Bei Situationen dieses Typs ist die Korrektur der falschen Informationen ein relativ einfacher ProzessDies erfordert nichts weiter, als den falschen Text zu ändern und die Änderungen zu speichern. Unternehmen verwalten diesen Prozess manchmal, indem sie Daten nach der Eingabe von Daten korrigieren und die erforderlichen Aktualisierungen erstellen.

schmutzige Daten können auch auftreten, da vorhandene Datensätze bei Änderungen der Informationen nicht aktualisiert werden können. Wenn Verkäufer beispielsweise keine Kundendateien aktualisieren, wenn Personaländerungen bei einem bestimmten Kunden auftreten, sind diese Dateien nicht mehr korrekt und werden als schmutzig angesehen. Wie bei der Korrektur von Rechtschreib- und Interpunktionsfehlern trägt die Zeit, veraltete Informationen zu entfernen und durch aktuelle Daten zu ersetzen, die Gesamtnutzbarkeit der Datenbank zu erhöhen.

Es gibt Situationen, in denen die Schaffung schmutziger Daten beabsichtigt ist. Unternehmen können sich dafür entscheiden, bestimmte Informationen aus einer Datenbank auszulassen, um eine spezifische Wahrnehmung in Bezug auf Finanzen zu erstellen, z. B. das Hervorheben der Menge von GENerierte Einnahmen für einen bestimmten Zeitraum, aber die Entscheidung, keine Daten einzugeben, die sich auf die Höhe der gesammelten Einnahmen für den gleichen Zeitraum beziehen. In dieser Art von schmutzigen Daten sind die vorgestellten Informationen so weit wie möglich genau, aber als unvollständig angesehen.

Mit einigen Arten von schmutzigen Daten kann die Entscheidung darin bestehen, sich nicht die Zeit und Mühe zu nehmen, um Korrekturen vorzunehmen. Dies ist üblich, wenn die falschen Daten keinen Einfluss auf die Fähigkeit des Unternehmens haben, ordnungsgemäß zu funktionieren, oder kein Potenzial für eine große Belastung darstellt. Dies bedeutet, dass nahezu jedes Unternehmen, das eine Art Datenbank verwaltet, wahrscheinlich mindestens ein wenig schmutzige Daten hat, die mit anderen Informationen durchsetzt sind, die aktuell und genau sind.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?