สถาปัตยกรรมคลังข้อมูลคืออะไร

สถาปัตยกรรมคลังข้อมูลเป็นการออกแบบที่ห่อหุ้มทุกแง่มุมของการทำคลังข้อมูลสำหรับสภาพแวดล้อมขององค์กร คลังข้อมูลคือการสร้างโดเมนกลางเพื่อจัดเก็บข้อมูลองค์กรที่มีการกระจายอำนาจที่ซับซ้อนในหน่วยทางลอจิคัลที่ช่วยให้การขุดข้อมูล, ระบบธุรกิจอัจฉริยะและการเข้าถึงข้อมูลที่เกี่ยวข้องทั้งหมดภายในองค์กรโดยรวม สถาปัตยกรรมคลังข้อมูลนั้นรวมถึงข้อกำหนดการรายงานทั้งหมดการจัดการข้อมูลข้อกำหนดด้านความปลอดภัยข้อกำหนดวงกว้างและข้อกำหนดด้านการจัดเก็บ

เมื่อสร้างสถาปัตยกรรมคลังข้อมูลสิ่งสำคัญคือการแบ่งสถาปัตยกรรมออกเป็นโดเมนเฉพาะที่รวมเข้ากับการออกแบบขั้นสุดท้ายแบบองค์รวม การออกแบบนี้ควรพิจารณาว่าเป็นการพิมพ์สีน้ำเงินสำหรับสถาปัตยกรรมข้อมูลขององค์กร โดยเฉพาะอย่างยิ่งพื้นที่หลักหลายแห่งควรได้รับการพัฒนาเมื่อพิจารณาสถาปัตยกรรมคลังข้อมูล พื้นที่เหล่านี้คือการเข้าถึงระบบต้นทางกระบวนการจัดเตรียมกระบวนการปรับปรุงข้อมูลสถาปัตยกรรมข้อมูลกระบวนการทางธุรกิจและข้อกำหนดการจัดเก็บ

คลังข้อมูลต้องมีการถ่ายโอนแหล่งข้อมูลจากทรานแซคชันหรือฐานข้อมูลของการบันทึกลงในคลังข้อมูล กระบวนการนี้ง่ายขึ้นในคำว่า Extract Transform and Load (ETL) ซึ่งโดยทั่วไปแล้วจะห่อหุ้มพื้นที่ของการเข้าถึงระบบต้นทางการเพิ่มประสิทธิภาพข้อมูลและสถาปัตยกรรมข้อมูล เพื่อความชัดเจนมันจะดีกว่าในการออกแบบพื้นที่สถาปัตยกรรมเหล่านี้ในรายละเอียดซึ่งแสดงให้เห็นว่ากระบวนการ ETL จะสำเร็จได้อย่างไร ในขณะที่ข้อมูลบางอย่างจำเป็นต้องใช้จากระบบต้นทางข้อมูลทั้งหมดไม่เป็นที่ต้องการเนื่องจากจะทำให้คลังสินค้าขององค์กรทำงานหนักเกินไป พื้นที่หลักของความกังวลเมื่อกล่าวถึงเลเยอร์ระบบต้นทางคือวิธีการเข้าถึงข้อมูลข้อมูลที่ต้องการจากระบบต้นทางและข้อกำหนดการรีเฟรช

เลเยอร์สถาปัตยกรรมคลังข้อมูลถัดไปที่ต้องพิจารณาคือกระบวนการพื้นที่การแสดง เนื่องจากข้อมูลส่วนใหญ่จากระบบต้นทางจะต้องมีการตรวจสอบความถูกต้องและการล้างข้อมูลจึงเป็นสิ่งสำคัญที่จะต้องสร้างโซนเชื่อมโยงไปถึงเพื่อให้แหล่งข้อมูลอยู่ก่อนที่จะโหลดลงในเลเยอร์กฎธุรกิจของคลังข้อมูล พื้นที่การเก็บรักษารักษาฟีดข้อมูลดิบจากระบบต้นทางที่โดยทั่วไปจะประทับเวลาเพื่อให้แน่ใจว่าข้อมูลล่าสุด

กระบวนการเพิ่มประสิทธิภาพข้อมูลหรือกฎเกณฑ์ทางธุรกิจคือที่ซึ่งข้อมูลถูกล้างเพื่อให้ได้ผลลัพธ์ที่ต้องการของคลังข้อมูล ตัวอย่างที่ดีของวิธีการล้างข้อมูลนี้คือการใช้เครื่องมือล้างที่อยู่ ในกรณีที่ระบบต้นทางมีข้อมูลที่ไม่ถูกต้องกระบวนการเพิ่มประสิทธิภาพของข้อมูลจะเรียกใช้ที่อยู่จากข้อมูลดิบที่ตั้งค่าไว้ในระบบกฎธุรกิจที่จะแก้ไขที่อยู่ที่ไม่ถูกต้อง นี่เป็นเวลาที่ข้อมูลที่ไม่ถูกต้องจะถูกลบหรือแก้ไขเพื่อความสมบูรณ์ภายในคลังข้อมูล

เลเยอร์ถัดไปที่ต้องพิจารณาคือเลเยอร์สถาปัตยกรรมข้อมูล พื้นที่นี้เป็นที่ที่การออกแบบหรือสคีมาจริงของคลังข้อมูลองค์กรเสร็จสมบูรณ์ คลังข้อมูลไม่ใช่การรวมกันของชุดข้อมูลทั้งหมดภายในองค์กร แต่เป็นฐานข้อมูลที่กำหนดใหม่ที่สร้างขึ้นเพื่อเปิดใช้งานภาพรวมของเอนทิตีธุรกิจทั้งหมดภายในองค์กร

สิ่งนี้ต้องการสถาปัตยกรรมข้อมูลเพื่อตอบคำถามที่ธุรกิจจะดำเนินการในส่วนของระบบธุรกิจอัจฉริยะและการขุดข้อมูล ด้วยการสร้างสถาปัตยกรรมข้อมูลในลักษณะนี้ชุดข้อมูลดิบจะถูกแปลงเป็นตารางข้อเท็จจริงที่จะช่วยให้ผู้ใช้ทำการรายงานแบบเฉพาะกิจในมุมมององค์กรทั้งหมดแทนที่จะเป็นฐานข้อมูลเฉพาะ นี่เป็นพื้นที่ที่จะรักษาข้อมูลเมตาเกี่ยวกับข้อมูลจากระบบ raw ซึ่งอาจรวมถึงชื่อระบบต้นทางหรือคีย์หลัก

สิ่งต่อไปที่ต้องพิจารณาคือข้อกำหนดทางธุรกิจและการรายงาน เลเยอร์นี้ถือได้ว่าเป็นข้อกำหนดที่ผู้ใช้งานต้องใช้กับคลังข้อมูล โดยทั่วไปพื้นที่นี้มีรายงานกระป๋องความสามารถในการรายงานเฉพาะกิจและแผงควบคุมองค์กรหรือการแจ้งเตือน เลเยอร์ข่าวกรองธุรกิจโดยทั่วไปจะได้รับการพิจารณามากที่สุดเนื่องจากเป็นองค์ประกอบภายนอกที่อยู่ภายในคลังข้อมูลเท่านั้น

เลเยอร์สุดท้ายสำหรับการพิจารณาคือข้อกำหนดในการจัดเก็บข้อมูลโดยรวมและการบำรุงรักษา ในขณะที่คลังข้อมูลเติบโตและขยายอย่างต่อเนื่องการจัดเก็บข้อมูลพื้นฐานของผู้ใช้จะต้องได้รับการจัดการและบำรุงรักษาอย่างเคร่งครัด นอกจากนี้ในขณะที่สร้างสถาปัตยกรรมคลังข้อมูลการออกแบบควรทำการประเมินตามความเป็นจริงเกี่ยวกับสิ่งที่จะต้องใช้ในการจัดเก็บข้อมูลและแบนด์ที่มีความสามารถในการเข้าถึงข้อมูล ข้อกำหนดเหล่านี้จะมีความสำคัญเนื่องจากคลังข้อมูลมีการใช้อย่างกว้างขวางทั่วทั้งองค์กร