Skip to main content

Hvad er Data Warehouse Architecture?

Data Warehouse Architecture er et design, der indkapsler alle facetter af datalager for et virksomhedsmiljø.Dataopbevaring er oprettelsen af et centralt domæne til at gemme komplekse, decentrale virksomhedsdata i en logisk enhed, der muliggør datamining, forretningsinformation og generel adgang til alle relevante data i en organisation.Data Warehouse Architecture er inkluderende for alle rapporteringskrav, datastyring, sikkerhedskrav, krav til båndbredde og opbevaringskrav.

Når man opretter en datalagerarkitektur, er det vigtigt at opdele arkitekturen i specifikke domæner, der er tilsluttet en holistisk finaledesign.Dette design skal betragtes som det blå print for Enterprise Data Architecture.Især bør flere primære områder udvikles, når man overvejer datalagerarkitektur.Disse områder er kildesystemadgang, iscenesættelsesområdeproces, databerigelsesproces, dataarkitektur, forretningsinformationsproces og opbevaringskrav.

Dataopbevaring kræver, at kildedata overføres fra en transaktion eller database med post til datalageret.Denne proces er forenklet til udtrykket ekstrakttransformation og belastning (ETL), der dybest set indkapsler områderne kildesystemadgang, databerigelse og dataarkitektur.Af hensyn til klarhed er det bedre at designe disse arkitektoniske områder i detaljer, hvilket skitserer, hvordan ETL -processen vil blive opnået.Mens nogle data kræves fra kildesystemerne, er alle data ikke ønskelige, da de ville overbelaste virksomhedslageren.De primære bekymringsområder, når man adresserer kildesystemlaget, er datatilgangsmetoder, data, der kræves fra kildesystemet og opdateringskrav.

Det næste datalagring af arkitektonisk lag, der skal overvejes, er iscenesættelsesområdet.Da de fleste data fra kildesystemer vil kræve validering og rensning af data, er det vigtigt at oprette en landingszone til kildedata, der skal opholdes inden indlæsning i forretningsreglerne i datalageret.Iscenesættelsesområdet opretholder rå datafeeds fra kildesystemer, der typisk er stemplet for at sikre for nylig dataene.

Processen for data berigelse eller forretningsregler er, hvor data rengøres for at imødekomme det ønskede resultat af Data Warehouse.Et godt eksempel på denne rensningsmetode er at bruge adressernesrensningsværktøjer;I tilfælde af at kildesystemet har forkerte data, vil databerigelsesprocessen køre adressen fra det rå datasæt til et forretningsregelsystem, der ville korrigere ugyldige adresser.Dette er også det tidspunkt, hvor unøjagtige data slettes eller ændres for at sikre fuldstændighed inden for datalageret.

Det næste lag, der skal overvejes, er datakarchitekturlaget.Dette område er, hvor det sande design eller skema for Enterprise Data Warehouse er afsluttet.Datalagring i ikke en kombination af alle datasæt inden for en virksomhed, men i stedet er det en nyligt defineret database, der er bygget for at muliggøre en oversigt over alle forretningsenheder inden for virksomheden.

Dette kræver dataarkitekturen for at besvare de spørgsmål, der vil blive stillet af virksomheden inden for forretningsinformation og datamining.Ved at oprette dataarkitekturen på denne måde vil de rå datasæt blive omdannet til faktaborde, der giver brugerne mulighed for at udføre ad-hoc-rapportering om hele Enterprise View snarere end en bestemt database.Dette er også det område, der opretholder metadata om dataene fra det rå system, som kan omfatte kildesystemnavnet eller primære nøgler.

Det næste område, der skal overvejes, er forretningsinformation og rapporteringskrav.Dette lag kan betragtes som brugervendt krav til datalagring.Dette område indeholder typisk dåse rapporter, ad-hoc-rapporteringskapacitet og virksomhedsstråler eller alarmer.Forretning intelligencE-lag får normalt den mest overvejelse, da det er den eneste udadvendte komponent inden for datalageret.

Det sidste lag til behandling er de samlede datalagringskrav og vedligeholdelse.Når et datalager fortsætter med at vokse og udvide, skal brugerbaselagring strengt administreres og vedligeholdes.Selvom det opretter datalagerarkitektur, skal designet foretage realistiske estimater om, hvad der kræves, fra en datalagringskapacitet såvel som et bånd med datatilgangskapacitet.Disse krav vil være kritiske, da datalageret bliver vidt brugt i hele virksomheden.