Skip to main content

Cos'è l'architettura del data warehouse?

L'architettura del data warehouse è un design che incapsula tutte le sfaccettature del data warehousing per un ambiente aziendale.Data Warehousing è la creazione di un dominio centrale per archiviare dati aziendali complessi e decentralizzati in un'unità logica che consente il data mining, la business intelligence e l'accesso complessivo a tutti i dati rilevanti all'interno di un'organizzazione.L'architettura di data warehouse è compresa tutti i requisiti di reporting, la gestione dei dati, i requisiti di sicurezza, i requisiti di larghezza della banda e i requisiti di archiviazione.

Quando si crea un'architettura di data warehouse, è importante spezzare l'architettura in settori specifici che sono uniti in una finale olisticaprogetto.Questo design dovrebbe essere considerato la stampa blu per l'architettura dei dati aziendali.In particolare, è necessario sviluppare diverse aree primarie quando si considera l'architettura del data warehouse.Queste aree sono l'accesso al sistema di origine, il processo dell'area di gestione temporanea, il processo di arricchimento dei dati, l'architettura dei dati, il processo di business intelligence e i requisiti di archiviazione.

Data Warehousing richiede che i dati di origine vengano trasferiti da un database transazionale o di record nel data warehouse.Questo processo è semplificato nel termine trasformazione e carico di estratto (ETL), che sostanzialmente incapsula le aree di accesso al sistema di origine, arricchimento dei dati e architettura dei dati.Per motivi di chiarezza, è meglio progettare in dettaglio queste aree architettoniche, il che delinea come verrà raggiunto il processo ETL.Mentre alcuni dati sono richiesti dai sistemi di origine, tutti i dati non sono desiderabili in quanto sovraccaricherebbero il magazzino aziendale.Le aree primarie di preoccupazione quando si affrontano il livello del sistema di origine sono le metodologie di accesso ai dati, i dati richiesti dal sistema di origine e i requisiti di aggiornamento.

Il prossimo livello di architettura da data warehousing da considerare è il processo di stagamento.Poiché la maggior parte dei dati dei sistemi di origine richiederà la convalida e la pulizia dei dati, è importante creare una zona di atterraggio affinché i dati di origine possano risiedere prima del caricamento nel livello delle regole aziendali del data warehouse.L'area di stadiazione mantiene feed di dati grezzi da sistemi di origine che in genere sono timbrati nel tempo per garantire la recentezza dei dati.

L'arricchimento dei dati o il processo delle regole aziendali è il luogo in cui i dati vengono puliti per soddisfare il risultato desiderato del data warehouse.Un buon esempio di questo approccio di pulizia è l'uso di strumenti di pulizia degli indirizzi;Nel caso in cui il sistema di origine abbia dati errati, il processo di arricchimento dei dati eseguirà l'indirizzo dal set di dati grezzi in un sistema di regole aziendali che correggerebbe gli indirizzi non validi.Questo è anche il momento in cui i dati inaccurati vengono eliminati o modificati per garantire la completezza all'interno del data warehouse.

Il livello successivo da considerare è il livello di architettura dei dati.Quest'area è dove è completato il vero design o lo schema del data warehouse aziendale.Data Warehousing in non una combinazione di tutti i set di dati all'interno di un'impresa, ma è invece un database appena definito creato per consentire una panoramica di tutte le entità aziendali all'interno dell'Enterprise.

Ciò richiede all'architettura dei dati per rispondere alle domande che saranno poste dal business nell'area della business intelligence e del data mining.Creando l'architettura dei dati in questo modo, i set di dati grezzi verranno trasformati in tabelle di fatti che consentiranno agli utenti di eseguire report ad hoc sull'intera vista aziendale piuttosto che un database specifico.Questa è anche l'area che manterrà i metadati sui dati del sistema RAW, che potrebbero includere il nome del sistema di origine o le chiavi primarie.

L'area successiva da considerare è la business intelligence e i requisiti di segnalazione.Questo livello può essere considerato come il requisito rivolto all'utente per i data warehousing.In genere, quest'area contiene report in scatola, capacità di reporting ad hoc e bobine o avvisi aziendali.The Business IntelligencE i livelli normalmente prendono il massimo considerazione, in quanto è l'unico componente rivolto verso l'esterno all'interno del data warehouse.

Il livello finale per la considerazione è i requisiti complessivi di archiviazione dei dati e la manutenzione.Mentre un data warehouse continua a crescere ed espandersi, l'archiviazione dei dati di base di utenti deve essere rigorosamente gestita e mantenuta.Inoltre, durante la creazione dell'architettura del data warehouse, il design dovrebbe fare stime realistiche su ciò che sarà richiesto da una capacità di archiviazione dei dati e una banda con capacità di accesso ai dati.Questi requisiti saranno fondamentali poiché il data warehouse diventa ampiamente utilizzato in tutta l'azienda.