Skip to main content

Wat is datamining?

Data mining maakt gebruik van een relatief grote hoeveelheid rekenkracht die werkt op een grote set gegevens om regelmatigheden en verbindingen tussen gegevenspunten te bepalen.Algoritmen die technieken gebruiken uit statistieken, machine learning en patroonherkenning worden gebruikt om automatisch grote databases te doorzoeken.In de bedrijfswereld wordt datamining het meest gebruikt om de richting van trends te bepalen en de toekomst te voorspellen.Het wordt gebruikt om modellen en beslissingsondersteunende systemen te bouwen die mensen informatie geven die ze kunnen gebruiken.Datamining speelt een front-line rol in de strijd tegen terrorisme.Het werd zogenaamd gebruikt om de leider van de 9/11 aanvallen te bepalen.

Data-mijnwerkers zijn statistici die technieken gebruiken met namen als Near-bor-modellen ,

k-middelen clustering

, Holdout-methode , k-voldKruisvalidatie , de methode weg-one-out , enzovoort.Regressietechnieken worden gebruikt om irrelevante patronen af te trekken, waardoor alleen nuttige informatie achterblijft.De term Bayesian wordt vaak in het veld gezien, verwijzend naar een klasse van inferentietechnieken die de kans op toekomstige gebeurtenissen voorspellen door eerdere kansen en waarschijnlijkheden te combineren op basis van voorwaardelijke gebeurtenissen.In een beslissingsboom gaan alle gegevens door een toegangsknooppunt, waar het op een filter wordt geconfronteerd dat de gegevens in streams scheidt, afhankelijk van de kenmerken ervan.Gegevens over consumentengedrag worden bijvoorbeeld waarschijnlijk gefilterd op basis van demografische factoren.Datamining gaat niet in de eerste plaats over chique grafieken en visualisatietechnieken, maar het gebruikt ze wel om te laten zien wat het heeft gevonden.Het is bekend dat we visueel meer statistische informatie kunnen absorberen dan verbaal en dit formaat voor presentatie kan zeer overtuigend en krachtig zijn als ze in de juiste context worden gebruikt. Naarmate onze beschaving in toenemende mate gegevensverzadigd wordt en sensoren massaal worden verdeeld in onze lokaleOmgevingen zullen we onbedoeld dingen ontdekken die kunnen worden gemist bij de eerste pass over.Data Mining laat ons deze fouten corrigeren en nieuwe inzichten ontdekken op basis van gegevens uit het verleden, waardoor we meer waar zijn voor onze gegevensopslagbok.