Skip to main content

Vad är skillnaden mellan data mining och datalagring?

Villkoren Data Mining och Data Warehousing förvirras ofta av både affärs- och teknisk personal.Hela området för datahantering har upplevt en fenomenal tillväxt med implementeringen av programuppsamlingsprogram och de minskade kostnaderna för datorminne.Det primära syftet bakom båda dessa funktioner är att tillhandahålla verktyg och metoder för att utforska mönstren och betydelsen i stor mängd data.

De primära skillnaderna mellan data mining och datalager är systemkonstruktionerna, metodiken som används och syftet.Data mining är användningen av mönsterigenkänningslogik till identitetstrender inom en provdatauppsättning och extrapolerar denna information mot den större datapoolen.Datalagring är processen att extrahera och lagra data för att möjliggöra enklare rapportering.

Data mining är en allmän term som används för att beskriva en rad affärsprocesser som härleder mönster från data.Vanligtvis används ett statistiskt analysprogramvarupaket för att identifiera specifika mönster, baserat på datauppsättningen och frågor som genereras av slutanvändaren.En typisk användning av data mining är att skapa riktade marknadsföringsprogram, identifiera ekonomiskt bedrägeri och att flagga ovanliga mönster i beteende som en del av en säkerhetsgranskning.

Ett utmärkt exempel på data mining är processen som används av telefonföretag för att marknadsföra produkter till befintliga kunder.Telefonföretaget använder programvara för data mining för att få åtkomst till sin databas med kundinformation.En fråga skrivs för att identifiera kunder som har prenumererat på det grundläggande telefonpaketet och Internet -tjänsten under en viss tidsram.När denna datauppsättning har valts skrivs en annan fråga för att avgöra hur många av dessa kunder som utnyttjade gratis ytterligare telefonfunktioner under en prövningskampanj.Resultaten av denna data mining -övning avslöjar beteendemönster som kan driva eller hjälpa till att förfina en marknadsföringsplan för att öka användningen av ytterligare telefontjänster.

Det är viktigt att notera att det primära syftet med data mining är att upptäcka mönster i uppgifterna.Specifikationerna som används för att definiera provuppsättningen har en enorm inverkan på relevansen av utgången och analysens noggrannhet.Återvända till exemplet ovan, om datauppsättningen är begränsad till kunder inom ett specifikt geografiskt område, kommer resultaten och mönstren att skilja sig från en bredare datauppsättning.Även om både data mining och datalager fungerar med stora volymer information, är de använda processerna helt olika.

Ett datalager är en mjukvaruprodukt som används för att lagra stora volymer data och köra specifikt utformade frågor och rapporter.Business Intelligence är ett växande studieområde som fokuserar på datalagring och relaterad funktionalitet.Dessa verktyg är utformade för att extrahera data och lagra dem i en metod utformad för att ge förbättrad systemprestanda.Mycket av terminologin inom data mining och datalager är desamma, vilket leder till mer förvirring.