Skip to main content

Co jsou nástroje pro těžbu dat?

Nástroje pro těžbu dat jsou softwarové komponenty a teorie, které uživatelům umožňují extrahovat informace z dat.Nástroje poskytují jednotlivcům a společnostem schopnost shromažďovat velké množství dat a používat je k provedení určení konkrétního uživatele nebo skupin uživatelů.Některé z nejčastějších použití nástrojů pro těžbu dat jsou v oblasti marketingu, ochrany podvodů a dohledu.

Manuální extrakce dat existuje již stovky let.Automatizace těžby dat však byla nejčastější od úsvitu počítačového věku.Během 20. století se objevily různé počítačové vědy, které pomohly podpořit koncept vývoje nástrojů pro těžbu dat.Celkovým cílem využití nástrojů je odhalit skryté vzory.Pokud například marketingová společnost zjistí, že osoba podnikne měsíční výlet z New Yorku do Los Angeles, je pro tuto společnost prospěšné inzerovat podrobnosti o cíli jednotlivci.

V rámci odvětví těžby dat byly stanoveny standardy pro definování parametrů používání nástrojů pro těžbu dat.Asociace pro výpočet Machinerys Special Heates Group pro objevování znalostí a těžbu dat (SIGKDD) každoročně pořádá schůzku, aby určila, jaké procesy se používají.Stejná skupina je také zodpovědná za posouzení etických důsledků analýzy dat jednotlivců a společností.Biannual Journal je publikován skupinou s názvem SIGKDD Průzkumy.KDD byl vyvinut v roce 1989 Gregory Piatetsky-Shapiro.Pomocí tohoto nástroje pro těžbu dat jsou uživatelé schopni zpracovávat surová data, těžit data pro informace a interpretovat různé výsledky ve formě správy informací.

Jedna z nejdůležitějších forem nástrojů pro těžbu dat se používá pro boj proti terorismu v 21. století.Ve Spojených státech používá Národní rada pro výzkum koncepty těžby vzorů a těžby dat založené na předmětu k identifikaci teroristické činnosti ve velkém souboru informací po celém světě.Dolování vzorů je definována procesem lokalizace vzorů ve velkém objemu dat.Dolování dat založené na subjektu se pokouší identifikovat vztahy mezi jednotlivci.Obě techniky lze také využít v obecné obchodní praxi definováním myšlení zákaznické základny a interaktivního vztahu mezi zákazníky.