Skip to main content

Hvad er dataminingværktøjer?

Data mining -værktøjer er softwarekomponenter og teorier, der giver brugerne mulighed for at udtrække oplysninger fra data.Værktøjerne giver enkeltpersoner og virksomheder muligheden for at indsamle store mængder data og bruge dem til at træffe beslutninger om en bestemt bruger eller grupper af brugere.Nogle af de mest almindelige anvendelser af data mining -værktøjer er inden for markedsføring, svigbeskyttelse og overvågning.

Den manuelle ekstraktion af data har eksisteret i hundreder af år.Imidlertid har automatiseringen af datamining været mest udbredt siden computeralderens daggry.I løbet af det 20. århundrede dukkede forskellige computervidenskaber op for at hjælpe med at støtte konceptet med at udvikle dataminingværktøjer.Det overordnede mål med anvendelsen af værktøjerne er at afdække skjulte mønstre.For eksempel, hvis et marketingfirma finder ud af, at en person tager en månedlig tur fra New York City til Los Angeles, bliver det fordelagtigt for dette firma at annoncere detaljer om destinationen til den enkelte.

Inden for dataindustrien er der etableret standarder for at definere parametrene for brugen af data mining -værktøjer.Årligt afholder Association for Computing Machinerys Special Interest Group om videnopdagelse og data mining (SIGKDD) et møde for at bestemme, hvilke processer der bruges.Den samme gruppe er også ansvarlig for at vurdere de etiske implikationer af analysen af data fra enkeltpersoner og virksomheder.Et halvårligt tidsskrift offentliggøres af gruppen med titlen Sigkdd Explorations.

Det mest udbredte værktøj, der bruges i datamining, er processen kaldet videnopdagelse i databaser (KDD).KDD blev udviklet i 1989 af Gregory Piatetsky-Shapiro.Ved hjælp af dette dataminingværktøj er brugerne i stand til at behandle rå data, mine dataene for information og fortolke de forskellige resultater i form af informationsstyring.

En af de vigtigste former for dataminingværktøjer bruges til bekæmpelse af terrorisme i det 21. århundrede.I USA bruger National Research Council begreberne mønsterminedrift og fagbaseret datamining til at identificere terroraktivitet i den store information om informationen rundt om i verden.Mønsterminedrift defineres ved processen med at lokalisere mønstre inden for et stort antal data.Emnebaserede data mining forsøg på at identificere forhold mellem individer.Begge teknikker kan også bruges i generel forretningspraksis ved at definere tankegangen til et kundegrundlag og det interaktive forhold mellem kunderne.