Skip to main content

Ano ang arkitektura ng data ng bodega?

Ang arkitektura ng bodega ng data ay isang disenyo na sumasaklaw sa lahat ng mga facet ng data warehousing para sa isang kapaligiran ng negosyo.Ang Warehousing ng Data ay ang paglikha ng isang gitnang domain upang mag -imbak ng kumplikado, desentralisadong data ng negosyo sa isang lohikal na yunit na nagbibigay -daan sa pagmimina ng data, katalinuhan sa negosyo, at pangkalahatang pag -access sa lahat ng may -katuturang data sa loob ng isang samahan.Ang arkitektura ng bodega ng data ay kasama sa lahat ng mga kinakailangan sa pag -uulat, pamamahala ng data, mga kinakailangan sa seguridad, mga kinakailangan sa lapad ng banda, at mga kinakailangan sa imbakan.Disenyo.Ang disenyo na ito ay dapat isaalang -alang ang asul na pag -print para sa arkitektura ng data ng negosyo.Sa partikular, ang ilang mga pangunahing lugar ay dapat na binuo kapag isinasaalang -alang ang arkitektura ng bodega ng data.Ang mga lugar na ito ay pag -access ng system system, proseso ng staging area, proseso ng pagpapayaman ng data, arkitektura ng data, proseso ng intelihensiya ng negosyo, at mga kinakailangan sa imbakan.

Ang warehousing ng data ay nangangailangan ng data ng mapagkukunan na ilipat mula sa isang transactional o database ng record sa bodega ng data.Ang prosesong ito ay pinasimple sa term extract transform at load (ETL), na karaniwang sumasaklaw sa mga lugar ng pag -access ng system ng mapagkukunan, pagpapayaman ng data, at arkitektura ng data.Para sa kalinawan, mas mahusay na idisenyo nang detalyado ang mga lugar na ito ng arkitektura, na nagbabalangkas kung paano makamit ang proseso ng ETL.Habang ang ilang data ay kinakailangan mula sa mga source system, ang lahat ng data ay hindi kanais -nais dahil ito ay overburden ang bodega ng negosyo.Ang mga pangunahing lugar ng pag -aalala kapag tinutugunan ang layer ng source system ay mga pamamaraan ng pag -access ng data, data na kinakailangan mula sa mapagkukunan ng system, at pag -refresh ng mga kinakailangan.

Ang susunod na data warehousing architectural layer upang isaalang -alang ay ang proseso ng staging area.Tulad ng karamihan sa mga data mula sa mga sistema ng mapagkukunan ay mangangailangan ng pagpapatunay at paglilinis ng data, mahalaga na lumikha ng isang landing zone para sa data ng mapagkukunan upang manirahan bago mag -load sa layer ng mga patakaran ng negosyo ng bodega ng data.Ang lugar ng dula ay nagpapanatili ng mga hilaw na feed ng data mula sa mga sistema ng mapagkukunan na karaniwang oras na naselyohang upang matiyak ang kamakailan -lamang na data.

Ang proseso ng pagpapayaman ng data o mga patakaran sa negosyo ay kung saan nalinis ang data upang matugunan ang nais na kinalabasan ng bodega ng data.Ang isang mabuting halimbawa ng diskarte sa paglilinis na ito ay ang paggamit ng mga tool sa paglilinis ng address;Kung sakaling ang sistema ng mapagkukunan ay may maling data, ang proseso ng pagpapayaman ng data ay tatakbo ang address mula sa hilaw na data na itinakda sa isang sistema ng panuntunan sa negosyo na tama ang mga hindi wastong address.Ito rin ang oras kung saan ang hindi tumpak na data ay tinanggal o binago upang matiyak ang pagkakumpleto sa loob ng bodega ng data.

Ang susunod na layer na isaalang -alang ay ang layer ng arkitektura ng data.Ang lugar na ito ay kung saan nakumpleto ang tunay na disenyo o schema ng bodega ng data ng negosyo.Ang warehousing ng data sa hindi isang kumbinasyon ng lahat ng mga set ng data sa loob ng isang negosyo, ngunit sa halip ito ay isang bagong tinukoy na database na binuo upang paganahin ang isang pangkalahatang -ideya ng lahat ng mga nilalang sa negosyo sa loob ng negosyo.

Nangangailangan ito ng arkitektura ng data upang sagutin ang mga tanong na dadalhin ng negosyo sa lugar ng intelihensiya ng negosyo at pagmimina ng data.Sa pamamagitan ng paglikha ng arkitektura ng data sa paraang ito, ang mga hilaw na set ng data ay mababago sa mga talahanayan ng katotohanan na magpapahintulot sa mga gumagamit na magsagawa ng pag-uulat ng ad-hoc sa buong view ng negosyo sa halip pagkatapos ng isang tiyak na database.Ito rin ang lugar na magpapanatili ng metadata tungkol sa data mula sa RAW system, na maaaring isama ang pangalan ng sistema ng mapagkukunan o pangunahing mga susi.Ang layer na ito ay maaaring isipin bilang kinakailangan sa nakaharap sa gumagamit para sa warehousing ng data.Karaniwan, ang lugar na ito ay naglalaman ng mga de-latang ulat, kakayahan sa pag-uulat ng ad-hoc, at mga dash board o alerto ng enterprise.Ang Intelligenc ng NegosyoAng mga layer ay karaniwang nakakakuha ng pinakamaraming pagsasaalang-alang, dahil ito lamang ang panlabas na nakaharap na sangkap sa loob ng bodega ng data.

Ang pangwakas na layer para sa pagsasaalang-alang ay pangkalahatang mga kinakailangan sa imbakan ng data at pagpapanatili.Bilang isang bodega ng data ay patuloy na lumalaki at lumawak, ang imbakan ng data ng base ng gumagamit ay dapat na mahigpit na pinamamahalaan at mapanatili.Bilang karagdagan, habang lumilikha ng arkitektura ng bodega ng data, ang disenyo ay dapat gumawa ng makatotohanang mga pagtatantya tungkol sa kung ano ang kinakailangan na bumubuo ng isang kapasidad ng imbakan ng data pati na rin ang isang banda na may kapasidad ng pag -access ng data.Ang mga kinakailangang ito ay magiging kritikal dahil ang bodega ng data ay malawak na ginagamit sa buong negosyo.