Skip to main content

Hvad er beskidte data?

Dirty Data er et udtryk, der bruges til at beskrive enhver form for elektroniske data, der er forældet, ufuldstændig eller på anden måde ikke nøjagtige.Data af denne type kan oprettes på grund af fejl i dataindtastning, en manglende opdatering af dataene regelmæssigt eller endda indgangen til de samme data mere end én gang.Til tider er de forkerte data intet andet end fejl i tegnsætning i teksten til elektroniske dokumenter.I andre tilfælde kan beskidte data være oplysninger, der med vilje er vildledende, såsom forsøg på at ændre regnskabsregistre for at præsentere et specifikt image for investorer og andre.

For det meste er akkumulering af beskidte data i enhver form for database utilsigtet.Personer, der indtaster nye oplysninger i databasen, kan forkert stave ord, udelade tegnsætning, der er vigtig for at forstå tekstens intention eller undlader at følge en bestemt formateringsstrategi.Med situationer af denne type er det en relativt enkel proces at korrigere de forkerte oplysninger, der ikke kræver andet end at ændre den forkerte tekst og gemme ændringerne.Virksomheder administrerer undertiden denne proces ved korrekturlæsningsdata, efter at den er indtastet og foretaget de nødvendige opdateringer.

Dirty Data kan også forekomme på grund af en manglende opdatering af eksisterende poster, når information ændres.For eksempel, hvis sælgere ikke opdaterer kundefiler, når personaleændringer opstår med en given kunde, er disse filer ikke længere nøjagtige og betragtes som beskidte.Som med at korrigere stavemåde og tegnsætningsfejl, hjælper det at tage sig tid til at fjerne forældede oplysninger og erstatte dem med aktuelle data med at øge den samlede anvendelighed af databasen.

Der er situationer, hvor oprettelsen af beskidte data er forsætlig.Virksomheder kan vælge at udelade specifikke oplysninger fra en database for at skabe en bestemt opfattelse af økonomi, såsom at fremhæve mængden af genererede indtægter i en given periode, men vælger at ikke indtaste data, der vedrører mængden af indsamlet indtægter for det sammeperiode.I denne type beskidte data er de oplysninger, der præsenteres, nøjagtige så vidt dem, men betragtes som ufuldstændige.

Med nogle typer beskidte data kan beslutningen være at ikke tage sig tid og kræfter på at foretage korrektioner.Dette er almindeligt, når de forkerte data ikke har nogen indflydelse på virksomhedens evne til at fungere korrekt, eller udgør noget potentiale for at forårsage nogen stor nød.Dette betyder, at næsten enhver enhed, der opretholder en form for database, sandsynligvis har mindst lidt beskidte data ispedd andre oplysninger, der er aktuelle og nøjagtige.