Skip to main content

Hva er data mining?

Data mining bruker en relativt stor mengde datakraft som opererer på et stort sett med data for å bestemme regelmessigheter og tilkoblinger mellom datapunkter.Algoritmer som bruker teknikker fra statistikk, maskinlæring og mønstergjenkjenning brukes til å søke i store databaser automatisk.Data mining er også kjent som kunnskapsoppdagelse i databaser (KDD).

Som begrepet Kunstig intelligens , er data mining et paraplybegrep som kan brukes på en rekke forskjellige aktiviteter.I bedriftsverdenen brukes data mining hyppigst for å bestemme retningen på trender og forutsi fremtiden.Det brukes til å bygge modeller og beslutningsstøttesystemer som gir folk informasjon de kan bruke.Data mining tar en frontlinje rolle i kampen mot terrorisme.Det ble visstnok brukt til å bestemme lederen for angrepene fra 11. september.

Data Miners er statistikere som bruker teknikker med navn som Nærbormodeller , K-Means Clustering , Holdout-metoden , K-FoldKryss validering , én-en-out-metoden , og så videre.Regresjonsteknikker brukes til å trekke fra irrelevante mønstre, og etterlater bare nyttig informasjon.Begrepet Bayesian

sees ofte i feltet, og refererer til en klasse av inferensteknikker som forutsier sannsynligheten for fremtidige hendelser ved å kombinere tidligere sannsynligheter og sannsynligheter basert på betingede hendelser.Spamfiltrering er uten tvil en form for data mining, som automatisk bringer relevante meldinger til overflaten fra et kaotisk hav av phishing -forsøk og viagra -plasser.

beslutningstrær brukes til å filtrere fjell av data.I et beslutnings tre passerer alle data gjennom en inngangsnode, der det vender mot et filter som skiller dataene i strømmer avhengig av dens egenskaper.For eksempel vil data om forbrukeratferd sannsynligvis bli filtrert basert på demografiske faktorer.Data mining handler ikke først og fremst om fancy grafer og visualiseringsteknikker, men det bruker dem for å vise hva den har funnet.Det er kjent at vi kan absorbere mer statistisk informasjon visuelt enn verbalt, og dette formatet for presentasjon kan være veldig overbevisende og kraftig hvis det brukes i riktig sammenheng.

Etter hvert som vår sivilisasjon blir stadig mer datamettede og sensorer distribueres i masse til vår lokaleMiljøer, vil vi utilsiktet oppdage ting som kan gå glipp av på første passering.Data mining vil la oss rette opp disse feilene og oppdage nye innsikter basert på tidligere data, og gi oss mer smell for vår datalagringsspute.