Skip to main content

Co je architektura datového skladu?

Architektura Data Warehouse je design, který zapouzdřuje všechny aspekty skladování dat pro podnikové prostředí.Skladování dat je vytvoření centrální domény pro ukládání komplexních decentralizovaných podnikových dat v logické jednotce, která umožňuje těžbu dat, obchodní inteligenci a celkový přístup ke všem relevantním datům v rámci organizace.Architektura datového skladu zahrnuje všechny požadavky na podávání zpráv, správu dat, požadavky na zabezpečení, požadavky na šířku pásma a požadavky na skladování.design.Tento návrh by měl být považován za modrý tisk pro architekturu podnikových dat.Zejména by se při zvažování architektury datových skladů mělo rozvíjet zejména několik primárních oblastí.Tyto oblasti jsou přístup ke zdrojovému systému, procesu stagingu, proces obohacení dat, architektura dat, proces obchodní zpravodajství a požadavky na skladování.

Skladování dat vyžaduje přenos zdrojových dat z transakční nebo databáze záznamu do datového skladu.Tento proces je zjednodušen do termínu Transformace a zatížení termínu (ETL), který v podstatě zapouzdřuje oblasti přístupu ke zdrojovému systému, obohacení dat a architektury dat.Pro jasnost je lepší navrhnout tyto architektonické oblasti podrobně, což nastiňuje, jak bude proces ETL dosažen.Zatímco některá data jsou vyžadována ze zdrojových systémů, všechna data nejsou žádoucí, protože by přetížila podnikový sklad.Primárními oblastmi znepokojení při řešení vrstvy zdrojového systému jsou metodiky přístupu k datům, data požadovaná ze zdrojového systému a požadavky na obnovení.

Dalším architektonickou vrstvou, která je třeba zvážit, je proces skladů, která je třeba zvážit.Vzhledem k tomu, že většina dat ze zdrojových systémů bude vyžadovat ověření a čištění dat, je důležité vytvořit zónu přistání pro zdrojová data, která bude před načten do vrstvy obchodních pravidel datového skladu.Oblast stagingu udržuje surové datové krmivy ze zdrojových systémů, které jsou obvykle časově vyraženy, aby byla zajištěna nedávnost dat.

Proces obohacení údajů nebo obchodních pravidel je místem, kde jsou data vyčištěna pro splnění požadovaného výsledku datového skladu.Dobrým příkladem tohoto čisticího přístupu je použití nástrojů pro čištění adresy;V případě, že zdrojový systém má nesprávná data, proces obohacení dat spustí adresu ze sady surových dat do systému obchodních pravidel, který by napravil neplatné adresy.To je také doba, kdy jsou nepřesná data odstraněna nebo upravena, aby byla zajištěna úplnost ve skladu dat.Tato oblast je místem, kde je dokončen skutečný design nebo schéma podnikového datového skladu.Skladování dat v kombinaci všech souborů dat v podniku, ale místo toho se jedná o nově definovanou databázi vytvořenou tak, aby umožnila přehled všech obchodních subjektů v rámci podniku.

To vyžaduje, aby datová architektura odpovídala na otázky, které bude obsahovat podnikání v oblasti obchodní inteligence a dolování dat.Vytvořením datové architektury tímto způsobem budou sady dat RAW transformovány na tabulky faktů, které uživatelům umožní provádět ad-hoc hlášení o celém pohledu Enterprise, spíše než konkrétní databázi.Toto je také oblast, která bude udržovat metadata ohledně dat ze systému RAW, která by mohla zahrnovat název zdrojového systému nebo primární klíče.Tuto vrstvu lze považovat za požadavek na uživatelsky zaměření pro skladování dat.Tato oblast obvykle obsahuje konzervované zprávy, schopnost hlášení ad-hoc a desky nebo upozornění podnikového pomlčky.Obchodní inteligenceVrstvy E obvykle získávají nejvíce zvážení, protože je to jediná komponenta směřující ven v datovém skladu.

Závěrečnou vrstvou pro posouzení jsou celkové požadavky na ukládání dat a údržba.Vzhledem k tomu, že datový sklad neustále roste a rozšiřuje, musí být ukládání dat uživatelské základny přísně spravováno a udržováno.Navíc, při vytváření architektury datového skladu by měl návrh provést realistické odhady, co bude vyžadováno, z kapacity ukládání dat a také pás s kapacitou přístupu k datům.Tyto požadavky budou kritické, protože se datový sklad široce používá v celém podniku.