Skip to main content

Quali sono i diversi metodi di data mining?

Esistono diversi metodi di data mining utilizzati sia nelle opzioni software che nei concetti teorici.Questi consentono agli utenti di estrarre informazioni dai dati raccolti da persone e aziende che utilizzano una varietà di strumenti.Grandi quantità di dati possono essere utilizzate per determinare vari fattori in un singolo soggetto o varietà di soggetti.Questi metodi di data mining sono più comunemente utilizzati nei campi di protezione delle frodi, marketing e sorveglianza.

Per centinaia di anni, sono stati utilizzati metodi di data mining per estrarre informazioni da soggetti.Le tecniche moderne, tuttavia, utilizzano concetti automatizzati per fornire dati sostanziali tramite risorse computerizzate.Man mano che le scienze informatiche sono emerse durante il 20 ° secolo, il concetto di metodi di data mining si è sviluppato nel tentativo di superare i modelli nascosti in grandi fasce di dati raccolti.Un buon esempio di ciò è quando una società pubblicitaria che analizza i modelli di shopping di un cliente online.Questa azienda può quindi commercializzare alcuni prodotti che l'individuo può essere interessato all'acquisto.

Una tecnica di data mining utilizzata comunemente nel settore è chiamata Knowledge Discovery nei database (KDD).Sviluppato nel 1989 da Gregory Piatetsky-Shapiro, KDD consente agli utenti di elaborare i dati grezzi, analizzare le informazioni per i dati necessari e interpretare i risultati.Questo metodo consente agli utenti di trovare modelli negli algoritmi, tuttavia i dati generali non sono sempre accurati e possono essere messi insieme in modi compromettenti.Questo è noto come Overfitting .

I metodi di data mining di base coinvolgono quattro particolari tipi di attività: classificazione, clustering, regressione e associazione. Classificazione Prende le informazioni presenti e le unisce in raggruppamenti definiti. Clustering Rimuove i raggruppamenti definiti e consente ai dati di classificarsi con elementi simili. Regressione si concentra sulla funzione delle informazioni, modellando i dati sul concetto.Il metodo di data mining finale, Associazione , tenta di trovare relazioni tra i vari feed di dati.

Quando si utilizzano i vari metodi di data mining, vengono utilizzati alcuni standard per determinare quali parametri possono essere utilizzati nel processo.L'Associazione per il computing Machinerys Special Interest Group su Knowledge Discovery and Data Mining (SIGKDD) detiene una riunione annuale che determina quali processi sono appropriati.I fattori etici sono pesati insieme a applicazioni pratiche per trovare le migliori informazioni su individui e aziende.Questa informazione è pubblicata in una rivista industriale chiamata Sigkdd Explorations.