Skip to main content

Vad är smutsiga data?

Smutsiga data är en term som används för att beskriva alla typer av elektroniska data som är föråldrade, ofullständiga eller på annat sätt inte korrekt.Data av denna typ kan skapas på grund av fel i datainmatningen, ett misslyckande med att uppdatera data regelbundet eller till och med inträde av samma data mer än en gång.Ibland är felaktiga uppgifter inget annat än fel i skiljetecken i texten i elektroniska dokument.I andra fall kan smutsiga data vara information som är avsiktligt vilseledande, till exempel försök att ändra redovisningsregister för att presentera en specifik bild för investerare och andra.

För det mesta är ansamlingen av smutsiga data i alla typer av databas oavsiktlig.Individer som går in i ny information i databasen kan stava ord, lämna ut skiljetecken som är viktigt för att förstå avsikten med text eller misslyckas med att följa en specifik formateringsstrategi.Med situationer av denna typ är att korrigera felaktig information en relativt enkel process som inte kräver något annat än att ändra felaktig text och spara ändringarna.Företag hanterar ibland denna process genom korrekturläsning av data efter att den har angetts och gjort nödvändiga uppdateringar.

Smutsiga data kan också uppstå på grund av ett misslyckande med att uppdatera befintliga poster när information ändras.Till exempel, om säljare inte uppdaterar kundfiler när personaländringar inträffar med en given kund, är dessa filer inte längre korrekta och anses vara smutsiga.Liksom med korrigering av stavnings- och skiljetecken, tar det sig tid att ta bort föråldrad information och ersätta den med aktuella data för att öka databasens övergripande användbarhet.

Det finns situationer där skapandet av smutsiga data är avsiktligt.Företag kan välja att utelämna specifik information från en databas för att skapa en specifik uppfattning om ekonomi, till exempel att belysa mängden genererade intäkter under en viss period, men väljer att inte ange data som hänför sig till mängden insamlade intäkter för sammaperiod.I denna typ av smutsiga data är informationen som presenteras korrekt så långt den går, men anses vara ofullständig.

Med vissa typer av smutsiga data kan beslutet vara att inte ta tid och ansträngning för att göra korrigeringar.Detta är vanligt när felaktiga uppgifter inte har någon inverkan på verksamhetens förmåga att fungera korrekt, eller inte ger någon potential för att orsaka någon stor nöd.Detta innebär att nästan alla enheter som upprätthåller någon typ av databas förmodligen har åtminstone lite smutsig data isär med annan information som är aktuell och korrekt.