Skip to main content

Co jsou špinavá data?

Dirty Data je termín používaný k popisu jakéhokoli typu elektronických dat, který je zastaralý, neúplný nebo jinak přesný.Data tohoto typu mohou být vytvořena kvůli chybám při zadávání dat, neschopnost pravidelně aktualizovat data nebo dokonce zadání stejných dat více než jednou.Nesprávná data občas nejsou ničím jiným než chybami při interpunkci v textu elektronických dokumentů.V jiných případech mohou špinavá data být informace, které jsou záměrně zavádějící, jako jsou pokusy o úpravu účetních záznamů tak, aby investory a dalším představily konkrétní obrázek.

Z velké části je akumulace špinavých dat v jakémkoli typu databáze neúmyslná.Jednotlivci, kteří do databáze zadávají nové informace do databáze, mohou chytit slova, vynechat interpunkci, která je důležitá pro pochopení záměru textu, nebo nedodrží konkrétní strategii formátování.S situacemi tohoto typu je oprava nesprávných informací relativně jednoduchý proces, který nevyžaduje nic jiného než změnu nesprávného textu a uložení změn.Podniky někdy spravují tento proces tím, že po zadání a provedení nezbytných aktualizací.

Špinavá data se mohou také objevit v důsledku selhání aktualizace stávajících záznamů, když se změní informace.Například, pokud prodejci nedokážou aktualizovat soubory zákazníků, když dojde ke změnám personálu u daného zákazníka, tyto soubory již nejsou přesné a jsou považovány za špinavé.Stejně jako při opravě pravopisu a interpunkčních chyb, udělení času na odstranění zastaralých informací a jejich nahrazení aktuálních dat pomáhá zvýšit celkovou použitelnost databáze.

Existují situace, kdy je vytváření špinavých dat úmyslná.Společnosti se mohou rozhodnout vynechat konkrétní informace z databáze, aby vytvořily konkrétní vnímání týkající se financí, jako je zdůraznění množství generovaných příjmů za dané období, ale rozhodl se nezadat data, která se týká výše shromážděných příjmů za to samédoba.V tomto typu špinavých dat jsou prezentované informace přesné, pokud jde o to, ale jsou považovány za neúplné.

U některých typů špinavých dat může být rozhodnutím, že nebudete mít čas a úsilí k provedení oprav.To je běžné, když nesprávná data nemají žádný dopad na schopnost podniku správně fungovat nebo nepředstavují žádný potenciál způsobit žádnou velkou úzkost.To znamená, že téměř jakákoli entita, která udržuje nějaký typ databáze, má pravděpodobně alespoň trochu špinavých dat rozptýlených s jinými informacemi, které jsou aktuální a přesné.