Skip to main content

Wat zijn de verschillende methoden voor datamining?

Er zijn verschillende methoden voor datamining die worden gebruikt in zowel software -opties als theoretische concepten.Hiermee kunnen gebruikers informatie extraheren uit gegevens die zijn verzameld door personen en bedrijven die een verscheidenheid aan tools gebruiken.Grote hoeveelheden gegevens kunnen worden gebruikt om verschillende factoren te bepalen in een enkel onderwerp of verscheidenheid aan onderwerpen.Deze dataminingmethoden worden meestal gebruikt op het gebied van fraudebescherming, marketing en surveillance.

Al honderden jaren worden dataminingmethoden gebruikt om informatie van onderwerpen te extraheren.Moderne technieken gebruiken echter geautomatiseerde concepten om substantiële gegevens te verstrekken via geautomatiseerde bronnen.Naarmate de computerwetenschappen in de 20e eeuw ontstonden, is het concept van dataminingmethoden ontwikkeld in een poging verborgen patronen te overwinnen in grote delen van verzamelde gegevens.Een goed voorbeeld hiervan is wanneer een advertentiebedrijf de winkelpatronen van een online klant analyseert.Dit bedrijf kan vervolgens bepaalde producten op de markt brengen die het individu mogelijk geïnteresseerd is in de aankoop.

Eén dataminingtechniek die vaak in de industrie wordt gebruikt, wordt kennisontdekking genoemd in databases (KDD).Met KDD is in 1989 ontwikkeld door Gregory Piatetsky-Shapiro en kunnen gebruikers onbewerkte gegevens verwerken, de informatie voor noodzakelijke gegevens analyseren en de resultaten interpreteren.Met deze methode kunnen gebruikers patronen in de algoritmen vinden, maar de algemene gegevens zijn niet altijd nauwkeurig en kunnen op compromitterende manieren worden samengesteld. Classificatie neemt de aanwezige informatie over en gaat deze samen in gedefinieerde groeperingen.

Clustering

verwijdert de gedefinieerde groeperingen en stelt de gegevens in staat zichzelf te classificeren door vergelijkbare items. Regressie richt zich op de functie van de informatie en modellering van de gegevens over concept.De uiteindelijke dataminingmethode, associatie , probeert relaties te vinden tussen de verschillende gegevensfeeds. Bij het gebruik van de verschillende methoden voor datamining worden bepaalde normen gebruikt om te bepalen welke parameters in het proces kunnen worden gebruikt.De Association for Computing Machinerys Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD) heeft een jaarlijkse bijeenkomst die bepaalt welke processen geschikt zijn.Ethische factoren worden gewogen samen met praktische toepassingen om de beste informatie over individuen en bedrijven te vinden.Deze informatie wordt gepubliceerd in een industriejournaal genaamd sigkdd verkenningen.