Skip to main content

Hvad er de forskellige dataminingsmetoder?

Der er en række forskellige dataminingsmetoder, der bruges i både softwaremuligheder og teoretiske koncepter.Disse giver brugerne mulighed for at udtrække oplysninger fra data indsamlet af enkeltpersoner og virksomheder, der bruger en række forskellige værktøjer.Store mængder data kan bruges til at bestemme forskellige faktorer i et enkelt emne eller forskellige emner.Disse dataminingsmetoder anvendes oftest inden for felterne for svigbeskyttelse, markedsføring og overvågning.

I hundreder af år er dataminingmetoder blevet brugt til at udtrække oplysninger fra emner.Moderne teknikker bruger imidlertid automatiserede koncepter til at give betydelige data via edb -ressourcer.Da computervidenskab opstod i løbet af det 20. århundrede, udviklede begrebet dataminingmetoder i et forsøg på at overvinde skjulte mønstre i store skår af indsamlede data.Et godt eksempel på dette er, når et reklamefirma, der analyserer en online -kundes indkøbsmønstre.Dette firma kan derefter markedsføre visse produkter, som den enkelte kan være interesseret i at købe.

En dataminingsteknik, der ofte bruges i branchen, kaldes videnopdagelse i databaser (KDD).KDD er udviklet i 1989 af Gregory Piatetsky-Shapiro og giver brugerne mulighed for at behandle rå data, analysere oplysningerne for nødvendige data og fortolke resultaterne.Denne metode giver brugerne mulighed for at finde mønstre i algoritmerne, men de generelle data er ikke altid nøjagtige og kan sættes sammen på kompromitterende måder.Dette er kendt som Overfitting .

Grundlæggende dataminingmetoder involverer fire bestemte typer opgaver: klassificering, klynger, regression og forening. Klassificering Tager de tilstedeværende oplysninger og fusionerer dem til definerede grupperinger. Clustering Fjerner de definerede grupperinger og giver dataene mulighed for at klassificere sig selv med lignende emner. Regression Fokuserer på funktionen af informationen og modellerer dataene på konceptet.Den endelige dataminingmetode, Association , forsøger at finde forhold mellem de forskellige datafeeds.

Når du bruger de forskellige dataminingmetoder, bruges visse standarder til at bestemme, hvilke parametre der kan bruges i processen.Foreningen for computermaskiner Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD) har et årligt møde, der bestemmer, hvilke processer der er passende.Etiske faktorer vejes sammen med praktiske applikationer for at finde de bedste oplysninger om enkeltpersoner og virksomheder.Disse oplysninger offentliggøres i en branchebranche kaldet Sigkdd Explorations.