Skip to main content

Hva er forskjellen mellom data mining og datavarehus?

Begrepene data mining og datavarehus er ofte forvirret av både forretnings- og teknisk personell.Hele feltet for datahåndtering har opplevd en fenomenal vekst med implementering av datainnsamlingsprogrammer og de reduserte kostnadene for dataminne.Det primære formålet bak begge disse funksjonene er å gi verktøyene og metodologiene for å utforske mønstrene og betydningen i stor mengde data.

De primære forskjellene mellom data mining og datavarehus er systemdesignene, metodikken som brukes og formålet.Data mining er bruken av mønstergjenkjenningslogikk til identitetstrender i et eksempel på datasett og ekstrapolere denne informasjonen mot det større datapoolen.Datavarehus er prosessen med å trekke ut og lagre data for å tillate enklere rapportering.

Data mining er et generelt begrep som brukes for å beskrive en rekke forretningsprosesser som henter mønstre fra data.Vanligvis brukes en statistisk analyseprogramvarepakke for å identifisere spesifikke mønstre, basert på datasettet og spørsmålene generert av sluttbrukeren.En typisk bruk av data mining er å lage målrettede markedsføringsprogrammer, identifisere økonomisk svindel og å flagge uvanlige mønstre i atferd som en del av en sikkerhetsgjennomgang.

Et utmerket eksempel på data mining er prosessen som brukes av telefonselskaper for å markedsføre produkter til eksisterende kunder.Telefonselskapet bruker data mining -programvare for å få tilgang til databasen med kundeinformasjon.En spørring skrives for å identifisere kunder som har abonnert på den grunnleggende telefonpakken og internettjenesten over en bestemt tidsramme.Når dette datasettet er valgt, skrives det en annen spørring for å avgjøre hvor mange av disse kundene som benyttet seg av gratis ekstra telefonfunksjoner under en prøvekampanje.Resultatene fra denne data mining -øvelsen avslører atferdsmønstre som kan drive eller bidra til å avgrense en markedsføringsplan for å øke bruken av ytterligere telefontjenester.

Det er viktig å merke seg at det primære formålet med data mining er å oppdage mønstre i dataene.Spesifikasjonene som brukes til å definere prøvesettet har stor innvirkning på relevansen av utgangen og nøyaktigheten av analysen.Tilbake til eksemplet over, hvis datasettet er begrenset til kunder innenfor et spesifikt geografisk område, vil resultatene og mønstrene avvike fra et bredere datasett.Selv om både data mining og datavarehusarbeid med store mengder informasjon, er prosessene som brukes ganske forskjellige.

Et datavarehus er et programvareprodukt som brukes til å lagre store datamengder og kjøre spesielt designet spørsmål og rapporter.Business Intelligence er et voksende studieretning som fokuserer på datavarehus og relatert funksjonalitet.Disse verktøyene er designet for å trekke ut data og lagre dem i en metode designet for å gi forbedret systemytelse.Mye av terminologien i data mining og datavarehus er de samme, noe som fører til mer forvirring.