Skip to main content

Vad är data mining?

Data Mining använder en relativt stor mängd datorkraft som arbetar på en stor uppsättning data för att bestämma regelbundenhet och anslutningar mellan datapunkter.Algoritmer som använder tekniker från statistik, maskininlärning och mönsterigenkänning används för att söka i stora databaser automatiskt.Databrytning är också känd som kunskapsupptäckt i databaser (KDD).

Liksom termen Artificiell intelligens är data mining ett paraplyterm som kan tillämpas på ett antal olika aktiviteter.I företagsvärlden används data mining oftast för att bestämma trendernas riktning och förutsäga framtiden.Det används för att bygga modeller och beslutsstödssystem som ger människor information de kan använda.Data mining tar en frontlinjeroll i kampen mot terrorism.Det användes förmodligen för att bestämma ledaren för attackerna den 11 september.

Data gruvarbetare är statistiker som använder tekniker med namn som Near-Neighbor-modeller , K-Means Clustering , Hållningsmetod , K-FoldKorsvalidering , -ledningsmetoden , och så vidare.Regressionstekniker används för att subtrahera irrelevanta mönster, vilket bara lämnar användbar information.Termen Bayesian ses ofta i fältet, med hänvisning till en klass av inferensstekniker som förutsäger sannolikheten för framtida händelser genom att kombinera tidigare sannolikheter och sannolikheter baserade på villkorade händelser.Skräppostfiltrering är utan tvekan en form av data mining, som automatiskt ger relevanta meddelanden till ytan från ett kaotiskt hav av phishingförsök och viagra -tonhöjder.

Beslutsträd används för att filtrera berg av data.I ett beslutsträd passerar alla data genom en ingångsnod, där den vetter mot ett filter som separerar data i strömmar beroende på dess egenskaper.Till exempel kommer data om konsumentbeteende sannolikt att filtreras baserat på demografiska faktorer.Data mining handlar inte främst om snygga grafer och visualiseringstekniker, men den använder dem för att visa vad den har hittat.Det är känt att vi kan absorbera mer statistisk information visuellt än muntligt och detta format för presentation kan vara mycket övertygande och kraftfullt om det används i rätt sammanhang.

När vår civilisation blir allt mer datamättad och sensorer distribueras i massa i vår lokalaMiljöer, vi kommer oavsiktligt att upptäcka saker som kan missa vid det första passet.Data mining kommer att låta oss korrigera dessa misstag och upptäcka nya insikter baserade på tidigare data, vilket ger oss mer slag för vår datalagring.