Skip to main content

Wat is datawarehouse -architectuur?

Data Warehouse -architectuur is een ontwerp dat alle facetten van datawarehousing voor een enterprise -omgeving inkapselt.Data Warehousing is het creëren van een centraal domein om complexe, gedecentraliseerde bedrijfsgegevens op te slaan in een logische eenheid die datamining, business intelligence en algemene toegang tot alle relevante gegevens binnen een organisatie mogelijk maakt.Data Warehouse Architecture is inclusief alle rapportagevereisten, gegevensbeheer, beveiligingsvereisten, bandbreedtevereisten en opslagvereisten.ontwerp.Dit ontwerp moet worden beschouwd als de blauwe afdruk voor de Enterprise Data Architecture.In het bijzonder moeten verschillende primaire gebieden worden ontwikkeld bij het overwegen van datawarehouse -architectuur.Deze gebieden zijn toegang tot het bronsysteem, het verzamelgebiedsproces, het gegevensverrijkingsproces, de data -architectuur, het bedrijfsinformatieproces en de opslagvereisten.

Data warehousing vereist dat brongegevens worden overgedragen van een transactionele of database van record in het datawarehouse.Dit proces is vereenvoudigd in de term Extract -transformatie en belasting (ETL), die in feite de gebieden van brontoegang, gegevensverrijking en data -architectuur inkapselt.Voor de duidelijkheid is het beter om deze architecturale gebieden in detail te ontwerpen, wat beschrijft hoe het ETL -proces zal worden bereikt.Hoewel sommige gegevens vereist zijn van de bronsystemen, zijn alle gegevens niet wenselijk omdat het het Enterprise Warehouse zou overbelasten.De primaire aandachtsgebieden bij het aanpakken van de bron van de bronsysteem zijn methoden voor gegevenstoegang, gegevens die vereist zijn van het bronsysteem en de vernieuwingsvereisten.

De volgende datalhousing -architecturale laag om te overwegen is het verzamelgebiedsproces.Aangezien de meeste gegevens van bronsystemen validatie en gegevensreiniging vereisen, is het belangrijk om een landingszone te maken voor brongegevens om te verblijven voordat ze worden geladen in de bedrijfsregelslaag van het datawarehouse.Het staging -gebied onderhoudt onbewerkte gegevensfeeds van bronsystemen die doorgaans tijd worden gestempeld om de recentheid van gegevens te waarborgen.

Het procesverrijkings- of bedrijfsregelsproces is waar gegevens worden gereinigd om te voldoen aan het gewenste resultaat van het datawarehouse.Een goed voorbeeld van deze reinigingsaanpak is het gebruik van adresreinigingsgereedschappen;In het geval dat het bronsysteem onjuiste gegevens heeft, wordt het gegevensverrijkingsproces het adres uitgevoerd van de onbewerkte gegevensset in een bedrijfsregelsysteem dat ongeldige adressen zou corrigeren.Dit is ook het moment waarop onnauwkeurige gegevens worden verwijderd of gewijzigd om de volledigheid in het datawarehouse te waarborgen.

De volgende te overwegen laag is de gegevensarchitectuurlaag.Dit gebied is waar het ware ontwerp of schema van het Enterprise Data Warehouse is voltooid.Data Warehousing in niet een combinatie van alle gegevenssets binnen een onderneming, maar in plaats daarvan is het een nieuw gedefinieerde database die is gebouwd om een overzicht van alle zakelijke entiteiten binnen de onderneming mogelijk te maken.

Dit vereist de gegevensarchitectuur om de vragen te beantwoorden die door het bedrijf zullen worden gesteld op het gebied van business intelligence en datamining.Door de data-architectuur op deze manier te maken, worden de onbewerkte gegevenssets omgezet in feittabellen waarmee gebruikers ad-hocrapportage kunnen uitvoeren over de volledige enterprise-weergave in plaats van een specifieke database.Dit is ook het gebied dat de metagegevens zal behouden over de gegevens van het onbewerkte systeem, waaronder de naam van de bronsysteem of primaire toetsen.

Het volgende gebied dat moet worden overwogen, is de bedrijfsinformatie- en rapportagevereisten.Deze laag kan worden beschouwd als de gebruikersgerichte vereiste voor de datawarehousing.Doorgaans bevat dit gebied ingeblikte rapporten, ad-hoc rapportagemogelijkheden en bedrijfsstormen of meldingen.De Business IntelligencE-lagen worden normaal gesproken de meeste overweging, omdat dit de enige naar buiten gerichte component is in het datawarehouse.

De uiteindelijke laag voor overweging is algemene vereisten voor gegevensopslag en onderhoud.Naarmate een datawarehouse blijft groeien en uitbreiden, moet de opslag van gegevens op gebruikersbasis strikt worden beheerd en onderhouden.Bovendien moet het ontwerp tijdens het creëren van de datawarehouse -architectuur realistische schattingen maken over wat nodig is om een capaciteit van gegevensopslag te vormen, evenals een band met capaciteit voor gegevenstoegang.Deze vereisten zijn van cruciaal belang omdat het datawarehouse op grote schaal wordt gebruikt in de hele onderneming.