Skip to main content

Kiến trúc kho dữ liệu là gì?

Kiến trúc kho dữ liệu là một thiết kế gói gọn tất cả các khía cạnh của kho dữ liệu cho môi trường doanh nghiệp.Kho dữ liệu là việc tạo ra một miền trung tâm để lưu trữ dữ liệu doanh nghiệp phức tạp, phi tập trung trong một đơn vị logic cho phép khai thác dữ liệu, trí thông minh kinh doanh và truy cập tổng thể vào tất cả các dữ liệu liên quan trong một tổ chức.Kiến trúc kho dữ liệu bao gồm tất cả các yêu cầu báo cáo, quản lý dữ liệu, yêu cầu bảo mật, yêu cầu về chiều rộng của ban nhạc và yêu cầu lưu trữ. Khi tạo kiến trúc kho dữ liệu, điều quan trọng là phải chia kiến trúc thành các lĩnh vực cụ thể được tham gia vào một trận chung kết toàn diệnthiết kế.Thiết kế này nên được coi là bản in màu xanh cho kiến trúc dữ liệu doanh nghiệp.Cụ thể, một số lĩnh vực chính nên được phát triển khi xem xét kiến trúc kho dữ liệu.Các khu vực này là truy cập hệ thống nguồn, quy trình khu vực tổ chức, quy trình làm giàu dữ liệu, kiến trúc dữ liệu, quy trình thông minh kinh doanh và các yêu cầu lưu trữ.Kho lưu trữ dữ liệu yêu cầu dữ liệu nguồn được chuyển từ một cơ sở dữ liệu hoặc cơ sở dữ liệu của hồ sơ vào kho dữ liệu.Quá trình này được đơn giản hóa thành thuật ngữ Trích chuyển và tải (ETL), về cơ bản đóng gói các khu vực truy cập hệ thống nguồn, làm giàu dữ liệu và kiến trúc dữ liệu.Để rõ ràng, tốt hơn là thiết kế các khu vực kiến trúc này một cách chi tiết, trong đó phác thảo cách thức đạt được quá trình ETL.Mặc dù một số dữ liệu được yêu cầu từ các hệ thống nguồn, tất cả dữ liệu không mong muốn vì nó sẽ làm quá tải kho doanh nghiệp.Các lĩnh vực chính đáng quan tâm khi giải quyết lớp hệ thống nguồn là phương pháp truy cập dữ liệu, dữ liệu cần thiết từ hệ thống nguồn và yêu cầu làm mới.Lớp kiến trúc kho dữ liệu tiếp theo để xem xét là quy trình khu vực tổ chức.Vì hầu hết dữ liệu từ các hệ thống nguồn sẽ yêu cầu xác thực và làm sạch dữ liệu, điều quan trọng là tạo vùng hạ cánh để dữ liệu nguồn nằm trước khi tải vào lớp quy tắc kinh doanh của kho dữ liệu.Khu vực tổ chức duy trì các nguồn cấp dữ liệu thô từ các hệ thống nguồn thường được đóng dấu thời gian để đảm bảo sự gần đây của dữ liệu.Quá trình làm giàu dữ liệu hoặc quy tắc kinh doanh là nơi dữ liệu được làm sạch để đáp ứng kết quả mong muốn của kho dữ liệu.Một ví dụ điển hình về phương pháp làm sạch này là sử dụng các công cụ làm sạch địa chỉ;Trong trường hợp hệ thống nguồn có dữ liệu không chính xác, quá trình làm giàu dữ liệu sẽ chạy địa chỉ từ dữ liệu thô được đặt thành hệ thống quy tắc kinh doanh sẽ sửa các địa chỉ không hợp lệ.Đây cũng là thời điểm mà dữ liệu không chính xác bị xóa hoặc sửa đổi để đảm bảo tính đầy đủ trong kho dữ liệu. Lớp tiếp theo cần xem xét là lớp kiến trúc dữ liệu.Khu vực này là nơi hoàn thành thiết kế hoặc lược đồ của kho dữ liệu doanh nghiệp.Kho dữ liệu không phải là sự kết hợp của tất cả các tập dữ liệu trong doanh nghiệp, mà thay vào đó, đây là cơ sở dữ liệu mới được xây dựng để cho phép tổng quan về tất cả các thực thể kinh doanh trong doanh nghiệp.Điều này đòi hỏi kiến trúc dữ liệu phải trả lời các câu hỏi sẽ được doanh nghiệp đặt ra trong lĩnh vực khai thác dữ liệu và thông minh kinh doanh.Bằng cách tạo kiến trúc dữ liệu theo cách này, các bộ dữ liệu thô sẽ được chuyển thành các bảng thực tế cho phép người dùng thực hiện báo cáo đặc biệt trên toàn bộ chế độ xem doanh nghiệp thay vì một cơ sở dữ liệu cụ thể.Đây cũng là lĩnh vực sẽ duy trì siêu dữ liệu về dữ liệu từ hệ thống RAW, có thể bao gồm tên hệ thống nguồn hoặc khóa chính. Khu vực tiếp theo cần xem xét là các yêu cầu báo cáo và thông minh kinh doanh.Lớp này có thể được coi là yêu cầu đối mặt với người dùng đối với kho dữ liệu.Thông thường, khu vực này chứa các báo cáo đóng hộp, khả năng báo cáo đặc biệt và bảng điều khiển doanh nghiệp hoặc cảnh báo.Kinh doanh trí thông minhCác lớp E thường được xem xét nhiều nhất, vì đây là thành phần hướng ra ngoài duy nhất trong kho dữ liệu. Lớp cuối cùng để xem xét là các yêu cầu và bảo trì lưu trữ dữ liệu tổng thể.Khi kho dữ liệu tiếp tục phát triển và mở rộng, lưu trữ dữ liệu cơ sở người dùng phải được quản lý và duy trì nghiêm ngặt.Ngoài ra, trong khi tạo kiến trúc kho dữ liệu, thiết kế sẽ đưa ra các ước tính thực tế về những gì sẽ được yêu cầu tạo thành dung lượng lưu trữ dữ liệu cũng như một dải có khả năng truy cập dữ liệu.Những yêu cầu này sẽ rất quan trọng vì kho dữ liệu được sử dụng rộng rãi trong toàn bộ doanh nghiệp.