Skip to main content

Jaké jsou různé metody těžby dat?

Existuje celá řada různých metod těžby dat používaných jak v softwarových možnostech, tak v teoretických koncepcích.Umožňují uživatelům extrahovat informace z údajů shromážděných jednotlivci a společnostmi využívajícími různé nástroje.K určení různých faktorů u jediného subjektu nebo rozmanitosti subjektů lze použít velké množství dat.Tyto metody těžby dat se nejčastěji používají v oblastech ochrany podvodů, marketingu a dohledu.Moderní techniky však používají automatizované koncepty k poskytování podstatných údajů prostřednictvím počítačových zdrojů.Jak se během 20. století objevilo počítačové vědy, koncept metod těžby dat se vyvinul ve snaze překonat skryté vzorce ve velkých řádcích shromážděných dat.Dobrým příkladem je, když reklamní firma analyzující nákupní vzorce online zákazníka.Tato společnost pak může trvat určité produkty, které by jednotlivec mohl mít zájem o nákup.KDD, vyvinutá v roce 1989 Gregory Piatetsky-Shapiro, umožňuje uživatelům zpracovávat surová data, analyzovat informace pro nezbytná data a interpretovat výsledky.Tato metoda umožňuje uživatelům najít vzorce v algoritmech, ale obecná data však nejsou vždy přesná a mohou být sestavena kompromitujícími způsoby.Toto je známé jako

nadměrné množství

Základní metody těžby dat zahrnují čtyři konkrétní typy úkolů: klasifikace, shlukování, regrese a asociace. Klasifikace Vezme přítomné informace a sloučí je do definovaných seskupení.

Shlukování

Odstraňuje definovaná seskupení a umožňuje, aby se data klasifikovala podle podobných položek. Regrese se zaměřuje na funkci informací a modelování dat na konceptu.Konečná metoda těžby dat, asociace , se pokouší najít vztahy mezi různými datovými zdroji.Asociace pro výpočet Machinerys Special Heated Group pro objevování znalostí a těžbu dat (SIGKDD) pořádá výroční schůzku, která určuje, které procesy jsou vhodné.Etické faktory jsou zváženy spolu s praktickými aplikacemi, aby našli nejlepší informace o jednotlivcích a společnostech.Tato informace je zveřejněna v průmyslovém časopise s názvem SIGKDD Průzkumy