Skip to main content

Qual è la differenza tra data mining e data warehousing?

I termini data mining e data warehousing sono spesso confusi dal personale commerciale e tecnico.L'intero campo della gestione dei dati ha registrato una crescita fenomenale con l'implementazione dei programmi software di raccolta dei dati e il riduzione del costo della memoria del computer.Lo scopo principale alla base di entrambe queste funzioni è fornire gli strumenti e le metodologie per esplorare i modelli e il significato in una grande quantità di dati.

Le differenze primarie tra data mining e data warehousing sono i progetti di sistema, la metodologia utilizzata e lo scopo.Il data mining è l'uso della logica di riconoscimento dei pattern per le tendenze di identità all'interno di un set di dati di esempio ed estrapolare queste informazioni rispetto al pool di dati più ampio.Data Warehousing è il processo di estrazione e archiviazione di dati per consentire un report più semplice.

Il data mining è un termine generale utilizzato per descrivere una serie di processi aziendali che derivano modelli dai dati.In genere, viene utilizzato un pacchetto software di analisi statistica per identificare modelli specifici, in base al set di dati e alle query generate dall'utente finale.Un uso tipico del data mining è quello di creare programmi di marketing mirati, identificare frodi finanziarie e contrassegnare modelli insoliti nel comportamento come parte di una revisione della sicurezza.

Un eccellente esempio di data mining è il processo utilizzato dalle compagnie telefoniche per commercializzare i prodotti ai clienti esistenti.La compagnia telefonica utilizza software di data mining per accedere al suo database di informazioni sui clienti.Viene scritta una query per identificare i clienti che si sono iscritti al pacchetto telefonico di base e al servizio Internet per un periodo di tempo specifico.Una volta selezionato questo set di dati, viene scritta un'altra query per determinare quanti di questi clienti hanno sfruttato le funzionalità del telefono aggiuntive gratuite durante una promozione di prova.I risultati di questo esercizio di data mining rivelano modelli di comportamento che possono guidare o aiutare a perfezionare un piano di marketing per aumentare l'uso di ulteriori servizi telefonici.

È importante notare che lo scopo principale del data mining è individuare i modelli nei dati.Le specifiche utilizzate per definire il set di campioni hanno un impatto enorme sulla rilevanza dell'output e sull'accuratezza dell'analisi.Tornando all'esempio sopra, se il set di dati è limitato ai clienti all'interno di una specifica area geografica, i risultati e i modelli differiranno da un set di dati più ampio.Sebbene sia il data mining che il data warehousing funzionano con grandi volumi di informazioni, i processi utilizzati sono abbastanza diversi.

Un data warehouse è un prodotto software utilizzato per archiviare grandi volumi di dati ed eseguire query e report progettati appositamente.Business Intelligence è un campo di studio in crescita che si concentra sul data warehousing e sulla funzionalità correlata.Questi strumenti sono progettati per estrarre dati e archiviarli in un metodo progettato per fornire prestazioni di sistema migliorate.Gran parte della terminologia nel data mining e nel data warehousing sono le stesse, portando a una maggiore confusione.