Skip to main content

Co je klasifikace těžby dat?

Klasifikace těžby dat je jedním krokem v procesu dolování dat.Používá se ke seskupení položek na základě určitých klíčových charakteristik.Existuje několik technik používaných pro klasifikaci dolování dat, včetně klasifikace nejbližšího souseda, učení stromů rozhodování a podpory vektorových strojů.

Dolování dat je metoda, kterou vědci používají k extrahování vzorů z dat.Obecně je reprezentativní vzorek vybrán ze skupiny dat a poté manipulován a analyzován pro nalezení vzorů.Kromě klasifikace dolování dat mohou vědci také použít shlukování, regresi a učení pravidel k analýze dat.

Existuje několik algoritmů, které lze použít v klasifikaci dolování dat.Klasifikace nejbližšího souseda je jedním z nejjednodušších algoritmů klasifikace dolování dat.Spoléhá se na tréninkový soubor.Tréninková sada je sada dat používaných k trénování počítače do věnování pozornosti určitým proměnným.V klasifikaci nejbližšího souseda počítač jednoduše klasifikuje všechna data jako součást skupiny, která obsahuje data nejbližší hodnota pro vstup.Počítač v podstatě položí řadu otázek ohledně dat.Pokud je odpověď na první otázku pravdivá, položí otázku 2A.Pokud je odpověď nepravdivá, položí otázku 2b.Když je tato metoda vytažena, tvoří tato metoda strom větvících cest.Zeptá se řadu otázek o každém kusu dat a poté použije odpovědi k určení pravděpodobnosti, že data patří do konkrétní klasifikace.To se liší od učení stromu rozhodování, protože odpověď na první otázku nemá vliv na to, na kterou otázku bude dále položena.Tyto metody jsou počítačové modely, které by bylo obtížné ručně.Neuronové sítě se často používají v programování umělé inteligence, protože napodobuje lidský mozek.Filtruje informace prostřednictvím řady uzlů, které nacházejí vzory a poté klasifikují informace.Když jsou do stroje napájeny nové informace, je vynesena do grafu.Data jsou poté klasifikována na základě toho, do které kategorie jsou informace nejblíže k grafu.Tato metoda funguje pouze tehdy, pokud máte na výběr dvě možnosti.