Skip to main content

Cos'è ETL?

Pensalo come una pulizia della casa per i tuoi dati.ETL sta per estratto, trasformazione e carico.ETL è un software che consente alle aziende di consolidare i loro dati disparati mentre lo spostano da un luogo all'altro, e non importa davvero che tali dati siano in forme o formati diversi.I dati possono provenire da qualsiasi fonte.ETL è abbastanza potente da gestire tali disparità di dati.

Ad esempio, un istituto finanziario potrebbe avere informazioni su un cliente in diversi dipartimenti e ogni dipartimento potrebbe avere le informazioni sui clienti elencate in modo diverso.Il dipartimento di appartenenza potrebbe elencare il cliente per nome, mentre il dipartimento contabile potrebbe elencare il cliente per numero.ETL può raggruppare tutti questi dati e consolidarli in una presentazione uniforme, ad esempio per la memorizzazione in un database o un data warehouse.

Un altro modo in cui le aziende usano ETL è spostare in modo permanente le informazioni su un'altra applicazione.Ad esempio, i dati di elaborazione di testi potrebbero essere tradotti in numeri e lettere, che sono più facili da tracciare in un programma di calcolo o di database.Ciò è particolarmente utile per il backup delle informazioni mentre le aziende passano al nuovo software.

Una funzione importante di ETL è la pulizia dei dati.I protocolli di consolidamento ETL includono anche l'eliminazione di dati duplicati o frammentari, in modo che ciò che passa dalla porzione E del processo alla porzione L sia più facile da assimilare e/o archiviare.Tali operazioni di pulizia possono anche includere l'eliminazione di determinati tipi di dati dal processo.Se non si desidera includere determinate informazioni, puoi personalizzare il tuo ETL per eliminare quel tipo di informazioni dalla tua trasformazione.

La parte t dell'equazione, ovviamente, è la più potente.ETL può trasformare non solo i dati da diversi dipartimenti, ma anche i dati da fonti diverse.Ad esempio, i dati in un programma di posta elettronica come Microsoft Outlook potrebbero essere trasformati direttamente insieme ai dati di un'applicazione di produzione SAP, con il risultato che è i dati di un thread comune alla fine.Microsoft, ovviamente, crea un pacchetto ETL, così come Oracle e IBM.