Skip to main content

Was ist Data Warehouse Architecture?

Data Warehouse Architecture ist ein Design, das alle Facetten der Data Warehousing für eine Unternehmensumgebung zusammenfasst.Data Warehousing ist die Erstellung einer zentralen Domäne zum Speichern komplexer, dezentraler Unternehmensdaten in einer logischen Einheit, die Data Mining, Business Intelligence und Gesamtzugriff auf alle relevanten Daten innerhalb einer Organisation ermöglicht.Die Data Warehouse -Architektur umfasst alle Berichterstattungsanforderungen, Datenverwaltung, Sicherheitsanforderungen, Bandbreitenanforderungen und Speicheranforderungen.

Bei der Erstellung einer Data Warehouse -Architektur ist es wichtig, die Architektur in bestimmte Domänen zu unterteilen, die ein ganzheitliches Finale angeschlossen sindDesign.Dieses Design sollte als Blaudruck für die Enterprise -Datenarchitektur betrachtet werden.Insbesondere sollten bei der Berücksichtigung der Data Warehouse -Architektur mehrere Primärbereiche entwickelt werden.Diese Bereiche sind Zugriff auf das Quellsystem, den Prozess der Bereichen, Datenanreicherungsprozess, Datenarchitektur, Business Intelligence -Prozess und Speicheranforderungen.

Data Warehousing erfordert, dass Quelldaten aus einer Transaktions- oder Datenbank mit Datenbank in das Data Warehouse übertragen werden.Dieser Prozess wird in den Begriff Extrahierttransformation und -Last (ETL) vereinfacht, der die Bereiche des Zugangs zu Quellensystemen, der Datenanreicherung und der Datenarchitektur im Grunde genommen zusammenfasst.Aus Gründen der Klarheit ist es besser, diese architektonischen Bereiche im Detail zu entwerfen, wodurch der ETL -Prozess erreicht wird.Während einige Daten aus den Quellsystemen erforderlich sind, sind alle Daten nicht wünschenswert, da sie das Enterprise -Lagerhaus überlasten würden.Die primären Bereiche, die sich bei der Bekämpfung der Quellsystemschicht befassen, sind Datenzugriffsmethoden, Daten, die aus dem Quellsystem erforderlich sind, und die Aktualisierungsanforderungen.

Die nächste Data Warehousing -Architekturschicht ist der Staging Area -Prozess.Da die meisten Daten aus Quellsystemen eine Validierung und Datenreinigung erfordern, ist es wichtig, eine Landezone für Quelldaten zu erstellen, die sich vor dem Laden in die Geschäftsregelnschicht des Data Warehouse befinden.Der Staging -Bereich hält Rohdaten -Feeds von Quellsystemen bei, die in der Regel zeitlich gestempelt sind, um die jüngste Daten zu gewährleisten.

Der Prozess der Datenanreicherung oder des Geschäftsregelns wird von Daten gereinigt, um das gewünschte Ergebnis des Data Warehouse zu erfüllen.Ein gutes Beispiel für diesen Reinigungsansatz ist die Verwendung von Adressreinigungswerkzeugen.In dem Fall, dass das Quellsystem falsche Daten hat, wird der Datenanreicherungsprozess die Adresse aus dem Rohdatensatz in ein Geschäftsregelsystem ausgeführt, das ungültige Adressen korrigiert.Dies ist auch die Zeit, in der ungenaue Daten gelöscht oder geändert werden, um die Vollständigkeit innerhalb des Data Warehouse sicherzustellen.

Die nächste zu berücksichtigende Ebene ist die Datenarchitekturschicht.In diesem Bereich wird das wahre Design oder das wahre Schema des Enterprise Data Warehouse abgeschlossen.Data Warehousing in nicht in einer Kombination aller Datensätze innerhalb eines Unternehmens, sondern handelt es sich um eine neu definierte Datenbank, um einen Überblick über alle Unternehmenseinheiten innerhalb des Unternehmens zu erhalten.

Dies erfordert, dass die Datenarchitektur die Fragen beantwortet, die vom Unternehmen im Bereich von Business Intelligence und Data Mining gestellt werden.Durch das Erstellen der Datenarchitektur auf diese Weise werden die Rohdatensätze in Fakt-Tabellen umgewandelt, mit denen die Benutzer AD-hoc-Berichterstattung in der gesamten Unternehmensansicht ausführen können, anschließend eine bestimmte Datenbank.Dies ist auch der Bereich, der Metadaten über die Daten aus dem Rohsystem unterhält, die den Namen des Quellsystems oder die Primärschlüssel umfassen können.

Der nächste Bereich, den Sie berücksichtigen müssen, sind die Anforderungen an Business Intelligence und Reporting.Diese Schicht kann als die vom Benutzeranwendungen für die Data Warehousing angesehen werden.In der Regel enthält dieser Bereich Dosenberichte, Ad-hoc-Berichtsfunktionen und Enterprise-Dash-Boards oder Warnungen.Die Business IntelligencE-Schichten werden normalerweise die größte Überlegung erhalten, da dies die einzige nach außen gerichtete Komponente innerhalb des Data Warehouse ist.

Die endgültige Schicht für die Prüfung sind die allgemeinen Datenspeicheranforderungen und -wartungen.Da ein Data Warehouse weiter wächst und erweitert, muss die Datenspeicherung von Benutzerbasis streng verwaltet und gewartet werden.Bei der Erstellung der Data Warehouse -Architektur sollte das Design außerdem realistische Schätzungen darüber vornehmen, was erforderlich ist, um eine Datenspeicherkapazität sowie eine Bande mit Datenzugriffskapazität zu erhalten.Diese Anforderungen werden kritisch sein, da das Data Warehouse im gesamten Unternehmen weit verbreitet wird.