Skip to main content

Hva er datavarehusarkitektur?

Data lagerarkitektur er et design som omslutter alle fasetter av datavarehus for et bedriftsmiljø.Datavarehus er opprettelsen av et sentralt domene for å lagre komplekse, desentraliserte bedriftsdata i en logisk enhet som muliggjør data mining, forretningsintelligens og generell tilgang til alle relevante data i en organisasjon.Datavarehusarkitektur inkluderer alle rapporteringskrav, datahåndtering, sikkerhetskrav, krav til båndbredde og lagringskrav.

Når du oppretter et datavarehusarkitektur, er det viktig å dele arkitekturen til spesifikke domener som er sammen med en helhetlig finaledesign.Denne designen bør betraktes som det blå trykket for bedriftsdataarkitekturen.Spesielt bør det utvikles flere primære områder når man vurderer datavarehusarkitektur.Disse områdene er tilgang til kildesystem, iscenesettelsesområde, dataanrikningsprosess, dataarkitektur, forretningsintelligensprosess og lagringskrav.

Datavarehus krever at kildedata overføres fra en transaksjonell eller database med post til datavarehuset.Denne prosessen er forenklet til begrepet ekstrakttransform og belastning (ETL), som i utgangspunktet omslutter områdene for tilgang til kildesystemet, dataanriking og dataarkitektur.For klarhetens skyld er det bedre å designe disse arkitektoniske områdene i detalj, noe som skisserer hvordan ETL -prosessen vil oppnås.Mens det kreves noen data fra kildesystemene, er alle data ikke ønskelig, da det vil overbelaste bedriftslageret.De primære bekymringsområdene når du adresserer kildesystemlaget er metodologier for datatilgang, data som kreves fra kildesystemet og oppdateringskrav.

Det neste datavarehuset arkitektonisk lag å vurdere er iscenesettelsesområdet.Ettersom de fleste data fra kildesystemer vil kreve validering og datarensing, er det viktig å opprette en landingssone for kildedata som skal oppholde seg før lasting i forretningsreglene i datavarehuset.Iscenesettelsesområdet opprettholder rå data feeds fra kildesystemer som vanligvis er tid stemplet for å sikre nyheten i data.

Dataanriking eller forretningsregler er der data blir rengjort for å oppfylle det ønskede resultatet av datavarehuset.Et godt eksempel på denne rensende tilnærmingen er å bruke adresse rensende verktøy;I tilfelle kildesystemet har feil data, vil dataanrikingsprosessen kjøre adressen fra rå datasettet til et forretningsregel -system som vil rette ugyldige adresser.Dette er også tiden der unøyaktige data blir slettet eller endret for å sikre fullstendighet i datavarehuset.

Det neste laget du må vurdere er dataarkitekturlaget.Dette området er der den sanne utformingen eller skjemaet for Enterprise Data Warehouse er fullført.Datavarehus i ikke en kombinasjon av alle datasettene i en bedrift, men i stedet er det en nydefinert database bygget for å muliggjøre en oversikt over alle forretningsenheter i bedriften.

Dette krever at dataarkitekturen skal svare på spørsmålene som vil bli stilt av virksomheten innen forretningsintelligens og data mining.Ved å opprette dataarkitekturen på denne måten, vil rå data-settene bli omgjort til fakta tabeller som lar brukerne utføre ad-hoc-rapportering om hele bedriftsvisningen snarere enn en spesifikk database.Dette er også området som vil opprettholde metadata om dataene fra RAW -systemet, som kan omfatte kildesystemnavnet eller primærnøklene.

Det neste området du bør vurdere er forretningsintelligens og rapporteringskrav.Dette laget kan tenkes som det brukervendte kravet til datavarehuset.Vanligvis inneholder dette området hermetiske rapporter, ad-hoc rapporteringsevne og bedriftsdashtavler eller varsler.Business IntelligencE-lag får normalt mest vurdering, ettersom det er den eneste utadvendte komponenten i datavarehuset.

Det endelige laget for vurdering er generelle krav til datalagring og vedlikehold.Når et datavarehus fortsetter å vokse og utvides, må brukerbasert datalagring styres og vedlikeholdes strengt.I tillegg, mens du oppretter datavarehusarkitekturen, bør designen gi realistiske estimater for hva som vil være nødvendig fra en datalagringskapasitet så vel som et bånd med datatilgangskapasitet.Disse kravene vil være kritiske ettersom datavarehuset blir mye brukt i hele bedriften.