Skip to main content

Vad är Data Warehouse Architecture?

Data Warehouse Architecture är en design som omsluter alla aspekter av datalagring för en företagsmiljö.Datalager är skapandet av en central domän för att lagra komplexa, decentraliserade företagsdata i en logisk enhet som möjliggör data mining, affärsintelligens och total tillgång till all relevant information inom en organisation.Data Warehouse Architecture inkluderar alla rapporteringskrav, datahantering, säkerhetskrav, bandbreddkrav och lagringskrav.

När du skapar en datalagerarkitektur är det viktigt att dela upp arkitekturen i specifika domäner som förenas i en holistisk finaldesign.Denna design bör betraktas som det blå utskriften för företagets dataarkitektur.I synnerhet bör flera primära områden utvecklas när man överväger datalagerarkitektur.Dessa områden är källsystemåtkomst, iscensättningsprocess, dataanrikningsprocess, dataarkitektur, affärsintelligensprocess och lagringskrav.

Datalagring kräver att källdata ska överföras från en transaktionell eller databas med post till datalageret.Denna process förenklas i termen Extract Transform and Load (ETL), som i princip sammanfattar områdena för källsystemåtkomst, dataanrikning och dataarkitektur.För tydlighetens skull är det bättre att utforma dessa arkitektoniska områden i detalj, som beskriver hur ETL -processen kommer att uppnås.Även om vissa data krävs från källsystemen, är all data inte önskvärd eftersom de skulle överbelasta företagslagret.De primära områdena som är oroade när man adresserar källsystemskiktet är datatillgångsmetoder, data som krävs från källsystemet och uppdateringskrav.

Nästa datalagring av arkitektoniskt lager att överväga är iscensättningsområdet.Eftersom de flesta data från källsystem kommer att kräva validering och datatrengöring är det viktigt att skapa en landningszon för att källdata ska finnas innan de laddas i affärsreglerna i datalageret.Stagningsområdet upprätthåller rådataflöden från källsystem som vanligtvis är tidsstämpel för att säkerställa att data nyligen är.

Processen för dataanrikning eller affärsregler är där data rengörs för att möta det önskade resultatet av datalageret.Ett bra exempel på denna rengöringsmetod är att använda adressrengöringsverktyg;I händelse av att källsystemet har felaktiga data kommer databerikningsprocessen att köra adressen från rådatauppsättningen till ett affärsregelsystem som skulle korrigera ogiltiga adresser.Detta är också tiden där felaktiga data raderas eller modifieras för att säkerställa fullständighet inom datalageret.

Nästa lager att överväga är dataarkitekturlagret.Detta område är där den verkliga designen eller schemat i företagets datalager är klar.Datalagring i inte en kombination av alla datauppsättningar inom ett företag, utan istället är det en nyligen definierad databas byggd för att möjliggöra en översikt över alla affärsenheter inom företaget.

Detta kräver att dataarkitekturen svarar på de frågor som kommer att ställas av verksamheten inom området affärsintelligens och data mining.Genom att skapa dataarkitekturen på detta sätt kommer rådatauppsättningarna att omvandlas till fakta tabeller som gör att användarna kan utföra ad-hoc-rapportering om hela företagsvyn snarare än en specifik databas.Detta är också det område som kommer att upprätthålla metadata om uppgifterna från RAW -systemet, som kan inkludera källsystemnamnet eller primära nycklar.

Nästa område att överväga är kraven på affärsinformation och rapportering.Detta skikt kan betraktas som användarvändningskravet för datalagret.Vanligtvis innehåller detta område konserverade rapporter, ad-hoc-rapporteringskapacitet och företagets instrumentbrädor eller varningar.Business IntelligencE-lager får normalt mest hänsyn, eftersom det är den enda utåtvända komponenten i datalageret.

Det slutliga lagret för övervägande är övergripande datalagringskrav och underhåll.När ett datalager fortsätter att växa och expandera måste användarens dataslagring hanteras och underhålls strikt.Dessutom, medan du skapar datalagerarkitekturen, bör designen göra realistiska uppskattningar om vad som kommer att krävas från en datalagringskapacitet samt ett band med datatillgångskapacitet.Dessa krav kommer att vara kritiska när datalageret blir allmänt används i hela företaget.