Skip to main content

Co to są brudne dane?

Brudne dane to termin używany do opisania dowolnego rodzaju danych elektronicznych, które są przestarzałe, niekompletne lub w inny sposób nie dokładne.Dane tego typu mogą zostać utworzone z powodu błędów w wprowadzaniu danych, braku regularnego aktualizacji danych, a nawet wprowadzania tych samych danych więcej niż raz.Czasami nieprawidłowe dane są niczym więcej niż błędami w interpunkcji w tekście dokumentów elektronicznych.W innych przypadkach brudne dane mogą być informacją, które są celowo wprowadzające w błąd, takie jak próby modyfikacji rekordów rachunkowości, aby przedstawić konkretny obraz inwestorom i innym.

W większości akumulacja brudnych danych w dowolnej bazie danych jest niezamierzona.Osoby, które wprowadzają nowe informacje w bazie danych, mogą błędnie pomylić słowa, pomijać interpunkcję, która jest ważna dla zrozumienia zamiaru tekstu lub nie przestrzegają określonej strategii formatowania.W sytuacjach tego typu korygowanie nieprawidłowych informacji jest stosunkowo prostym procesem, który nie wymaga tylko zmiany nieprawidłowego tekstu i zapisania zmian.Firmy czasami zarządzają tym procesem, korektując dane po ich wprowadzeniu i dokonywaniu niezbędnych aktualizacji.

Brudne dane mogą również wystąpić z powodu braku aktualizacji istniejących rekordów po zmianie informacji.Na przykład, jeśli sprzedawcy nie aktualizują plików klientów, gdy zmiany personelu występują u danym klientem, pliki te nie są już dokładne i są uważane za brudne.Podobnie jak w przypadku poprawiania błędów pisowni i interpunkcyjnych, poświęcenie czasu na usunięcie przestarzałych informacji i zastąpienie ich bieżącymi danymi pomaga zwiększyć ogólną użyteczność bazy danych.

Istnieją sytuacje, w których tworzenie brudnych danych jest zamierzone.Firmy mogą wybrać szczegółowe informacje z bazy danych, aby stworzyć konkretne postrzeganie finansów, takie jak podkreślenie kwoty generowanych przychodów dla danego okresu, ale wybór nie wprowadzania danych dotyczących kwoty zebranych przychodów dla tego samegookres.W tego rodzaju brudnych danych przedstawione informacje są dokładne, o ile to możliwe, ale są uważane za niekompletne.

Przy niektórych rodzajach brudnych danych decyzją może być nie poświęcenie czasu i wysiłku w celu dokonania poprawek.Jest to powszechne, gdy nieprawidłowe dane nie mają żadnego wpływu na zdolność firmy do prawidłowego funkcjonowania lub nie stanowi potencjału powodowania wielkiego cierpienia.Oznacza to, że niemal każdy byt, który utrzymuje jakiś rodzaj bazy danych, prawdopodobnie ma co najmniej niewielkie brudne dane przeplatane z innymi informacjami, które są aktualne i dokładne.