Skip to main content

Cos'è il data mining?

Il data mining utilizza una quantità relativamente grande di potenza di calcolo che opera su un ampio set di dati per determinare regolarità e connessioni tra i punti dati.Gli algoritmi che impiegano tecniche da statistiche, apprendimento automatico e riconoscimento dei modelli vengono utilizzati per cercare automaticamente database di grandi dimensioni.Il data mining è anche noto come scoperta della conoscenza nei database (KDD).

Come il termine Intelligenza artificiale , il data mining è un termine ombrello che può essere applicato a una serie di attività variabili.Nel mondo aziendale, il data mining viene utilizzato più frequentemente per determinare la direzione delle tendenze e prevedere il futuro.È impiegato per costruire modelli e sistemi di supporto alle decisioni che forniscano alle persone informazioni che possono utilizzare.Il data mining assume un ruolo di prima linea nella battaglia contro il terrorismo.Presumibilmente è stato usato per determinare il leader degli attacchi dell'11 settembre.

I minatori di dati sono statistici che usano tecniche con nomi come modelli quasi colpi , clustering K-means , Metodo di mantenimento , K-FoldConvalida incrociata , il metodo Leave-One-Out e così via.Le tecniche di regressione vengono utilizzate per sottrarre modelli irrilevanti, lasciando solo informazioni utili.Il termine bayesiano è visto frequentemente sul campo, riferendosi a una classe di tecniche di inferenza che prevedono la probabilità di eventi futuri combinando probabilità e probabilità precedenti basate su eventi condizionali.Il filtraggio dello spam è probabilmente una forma di data mining, che porta automaticamente i messaggi pertinenti in superficie da un mare caotico di tentativi di phishing e piazzole di Viagra. Gli alberi decisionali vengono utilizzati per filtrare le montagne di dati.In un albero decisionale, tutti i dati passano attraverso un nodo di ingresso, dove affronta un filtro che separa i dati in flussi a seconda delle sue caratteristiche.Ad esempio, è probabile che i dati sul comportamento dei consumatori vengano filtrati in base a fattori demografici.Il data mining non riguarda principalmente i grafici fantasiosi e le tecniche di visualizzazione, ma li utilizza per mostrare ciò che ha trovato.È noto che possiamo assorbire più informazioni statistiche visivamente di quanto verbalmente e questo formato per la presentazione può essere molto persuasivo e potente se usato nel giusto contesto.

Man mano che la nostra civiltà diventa sempre più saturi e i sensori sono distribuiti in massa nel nostro localeambienti, scopriremo inavvertitamente cose che potrebbero mancare al primo passaggio.Il data mining ci consentirà di correggere questi errori e scoprire nuove intuizioni in base ai dati passati, dandoci più botto per il nostro dollaro di archiviazione dei dati.