Skip to main content

Jaký je rozdíl mezi těžbou dat a skladováním dat?

Pojmy těžba dat a skladování dat jsou často zaměňovány jak obchodní i technický personál.Celá oblast správy dat zažila fenomenální růst s implementací softwarových programů pro sběr dat a sníženými náklady na paměť počítače.Primárním účelem obou těchto funkcí je poskytnout nástroje a metodiky k prozkoumání vzorců a významu ve velkém množství dat.Dolování dat je použití logiky rozpoznávání vzorů pro trendy identity v rámci souboru dat vzorků a extrapolují tyto informace proti většímu fondu dat.Skladování dat je proces extrakce a ukládání dat, aby umožňoval snadnější hlášení.

Dolování dat je obecný termín používaný k popisu řady obchodních procesů, které odvozují vzorce z dat.Obvykle se softwarový balíček statistické analýzy používá k identifikaci specifických vzorců na základě souboru dat a dotazů generovaných koncovým uživatelem.Typickým využitím těžby dat je vytvoření cílených marketingových programů, identifikace finančních podvodů a označení neobvyklých vzorců v chování v rámci bezpečnosti.

Vynikajícím příkladem těžby dat je proces používaný telefonickými společnostmi k uvádění produktů na stávající zákazníky.Telefonní společnost používá software pro těžbu dat pro přístup ke své databázi informací o zákaznících.Je napsán dotaz na identifikaci zákazníků, kteří se přihlásili k odběru základního telefonického balíčku a internetové služby v konkrétním časovém rámci.Jakmile je tento soubor dat vybrán, je napsán další dotaz, který zjistí, kolik z těchto zákazníků využilo bezplatné další funkce telefonu během zkoušky.Výsledky tohoto cvičení těžby dat odhalují vzorce chování, které mohou řídit nebo pomoci zdokonalovat marketingový plán ke zvýšení využívání dalších telefonních služeb.

Je důležité si uvědomit, že primárním účelem dolování dat je zjistit vzorce v datech.Specifikace použité k definování sady vzorku mají obrovský dopad na význam výstupu a přesnost analýzy.Vrácení k výše uvedenému příkladu, pokud je soubor dat omezen na zákazníky v konkrétní geografické oblasti, výsledky a vzorce se budou lišit od širšího souboru dat.Ačkoli jak těžba dat, tak sklad dat pracují s velkými objemy informací, použité procesy jsou zcela odlišné.

Datový sklad je softwarový produkt, který se používá k ukládání velkých svazků dat a provozování speciálně navržených dotazů a zpráv.Business Intelligence je rostoucí oblast studia, která se zaměřuje na skladování dat a související funkce.Tyto nástroje jsou navrženy tak, aby extrahovaly data a ukládala je metodou navrženou tak, aby poskytovala zvýšený výkon systému.Většina terminologie při těžbě dat a sklad datových dat je stejná, což vede k většímu zmatku.