Skip to main content

Qu'est-ce que l'architecture de l'entrepôt de données?

L'architecture de l'entrepôt de données est une conception qui résume toutes les facettes de l'entreposage de données pour un environnement d'entreprise.L'entreposage de données est la création d'un domaine central pour stocker des données d'entreprise complexes et décentralisées dans une unité logique qui permet l'exploration de données, l'intelligence commerciale et l'accès global à toutes les données pertinentes au sein d'une organisation.L'architecture de l'entrepôt de données comprend toutes les exigences de déclaration, la gestion des données, les exigences de sécurité, les exigences de largeur des bandes et les exigences de stockage.

Lors de la création d'une architecture d'entrepôt de données, il est important de diviser l'architecture en domaines spécifiques qui sont joints à une finale holistiqueconception.Cette conception doit être considérée comme l'impression bleue de l'architecture de données d'entreprise.En particulier, plusieurs zones primaires doivent être développées lors de l'examen de l'architecture d'entrepôt de données.Ces domaines sont l'accès au système source, le processus de zone de mise en scène, le processus d'enrichissement des données, l'architecture des données, le processus de renseignement commercial et les exigences de stockage.

L'entreposage des données nécessite que les données source soient transférées à partir d'une base transactionnelle ou de la base de données d'enregistrement dans l'entrepôt de données.Ce processus est simplifié dans le terme transformée et charge d'extrait (ETL), qui résume essentiellement les zones d'accès au système source, d'enrichissement des données et d'architecture de données.Par souci de clarté, il est préférable de concevoir ces zones architecturales en détail, ce qui décrit la façon dont le processus ETL sera réalisé.Bien que certaines données soient nécessaires à partir des systèmes source, toutes les données ne sont pas souhaitables car elles surchargeraient l'entrepôt d'entreprise.Les principaux domaines de préoccupation lors de la lutte contre la couche du système source sont les méthodologies d'accès aux données, les données requises du système source et les exigences de rafraîchissement.

La prochaine couche architecturale d'entreposage de données à considérer est le processus de zone de mise en scène.Comme la plupart des données des systèmes source nécessiteront la validation et le nettoyage des données, il est important de créer une zone d'atterrissage pour les données source à résider avant de se charger dans la couche de règles métier de l'entrepôt de données.La zone de stadification maintient les flux de données brutes à partir de systèmes source qui sont généralement horrifiés pour assurer la récenseté des données.

Le processus d'enrichissement des données ou de règles métier est le cas où les données sont nettoyées pour respecter le résultat souhaité de l'entrepôt de données.Un bon exemple de cette approche de nettoyage consiste à utiliser des outils de nettoyage d'adresse;Dans le cas où le système source disposait de données incorrectes, le processus d'enrichissement des données exécutera l'adresse à partir de l'ensemble de données brutes dans un système de règles commerciales qui corrigerait les adresses non valides.C'est également le moment où des données inexactes sont supprimées ou modifiées pour garantir l'exhaustivité dans l'entrepôt de données.

La couche suivante à considérer est la couche d'architecture de données.Ce domaine est l'endroit où le véritable design ou le schéma de l'entrepôt de données d'entreprise est terminé.L'entreposage de données non pas une combinaison de tous les ensembles de données au sein d'une entreprise, mais il s'agit plutôt d'une base de données nouvellement définie conçue pour permettre un aperçu de toutes les entités commerciales au sein de l'entreprise.

Cela nécessite que l'architecture de données réponde aux questions qui seront posées par l'entreprise dans le domaine de l'intelligence commerciale et de l'exploration de données.En créant l'architecture de données de cette manière, les ensembles de données bruts seront transformés en tables de fait qui permettront aux utilisateurs d'effectuer des rapports ad hoc sur l'ensemble de la vue d'entreprise plutôt que d'une base de données spécifique.Il s'agit également du domaine qui maintiendra des métadonnées sur les données du système brut, qui pourraient inclure le nom du système source ou les clés primaires.

La prochaine zone à considérer est les exigences de l'intelligence commerciale et de la déclaration.Cette couche peut être considérée comme l'exigence orientée utilisateur pour l'entreposage de données.En règle générale, cette zone contient des rapports en conserve, des capacités de rapport ad hoc et des cartes ou alertes de tableau de bord en entreprise.The Business IntelligenceLes couches E obtiennent normalement le plus de considération, car c'est le seul composant orienté vers l'extérieur dans l'entrepôt de données.

La couche finale à considérer est les exigences et la maintenance globales de stockage des données.Alors qu'un entrepôt de données continue de croître et de se développer, le stockage de données de base d'utilisateurs doit être strictement géré et maintenu.De plus, lors de la création de l'architecture de l'entrepôt de données, la conception devrait faire des estimations réalistes quant à ce qui sera nécessaire pour former une capacité de stockage de données ainsi qu'une bande avec une capacité d'accès aux données.Ces exigences seront essentielles à mesure que l'entrepôt de données deviendra largement utilisé dans toute l'entreprise.