Skip to main content

Các loại thiết kế kho dữ liệu khác nhau là gì?

Kho dữ liệu lưu trữ một lượng lớn dữ liệu để sử dụng trong nhiều lĩnh vực khác nhau.Có hai loại thiết kế kho dữ liệu chính: từ trên xuống và từ dưới lên.Hai thiết kế có lợi thế và nhược điểm của riêng họ.Từ dưới lên dễ dàng và rẻ hơn để thực hiện, nhưng nó ít hoàn chỉnh hơn và các mối tương quan dữ liệu là lẻ tẻ hơn.Trong một thiết kế từ trên xuống, các kết nối giữa dữ liệu là rõ ràng và được thiết lập tốt, nhưng dữ liệu có thể đã lỗi thời và hệ thống rất tốn kém để thực hiện.

Dữ liệu là con số trung tâm trong thiết kế kho dữ liệu.Dữ liệu Mart là một tập hợp dữ liệu dựa trên một khái niệm duy nhất.Mỗi dữ liệu Mart là một tập hợp dữ liệu duy nhất và đầy đủ của dữ liệu.Mỗi bộ sưu tập này hoàn toàn tương quan trong nội bộ và thường có kết nối với dữ liệu bên ngoài. Cách xử lý dữ liệu được xử lý là sự khác biệt chính giữa hai kiểu thiết kế kho dữ liệu.Trong thiết kế từ trên xuống, các mart dữ liệu xảy ra một cách tự nhiên khi dữ liệu được đưa vào hệ thống.Trong thiết kế từ dưới lên, các mart dữ liệu được tạo trực tiếp và kết nối với nhau để tạo thành kho.Mặc dù điều này có vẻ như là một sự khác biệt nhỏ, nhưng nó tạo ra một thiết kế rất khác.

Phương pháp từ trên xuống là thiết kế kho dữ liệu gốc.Sử dụng phương pháp này, tất cả các thông tin mà tổ chức nắm giữ được đưa vào hệ thống.Mỗi chủ đề rộng sẽ có khu vực chung riêng trong cơ sở dữ liệu.Khi dữ liệu được sử dụng, các kết nối sẽ xuất hiện giữa các điểm dữ liệu tương quan và dữ liệu MART sẽ xuất hiện.Ngoài ra, bất kỳ dữ liệu nào trong hệ thống vẫn ở đó mãi mãi mdash; ngay cả khi dữ liệu được thay thế hoặc tầm thường hóa bởi thông tin sau này, nó sẽ ở trong hệ thống như một bản ghi của các sự kiện trong quá khứ. Phương pháp thiết kế kho dữ liệu từ dưới lên hoạt động từhướng đối diện.Một công ty đặt thông tin như một dữ liệu độc lập.Khi thời gian trôi qua, các bộ dữ liệu khác được thêm vào hệ thống, là dữ liệu của chính họ hoặc là một phần của dữ liệu đã tồn tại.Khi hai mart dữ liệu được coi là đủ kết nối, chúng hợp nhất với nhau thành một đơn vị.Phương pháp từ trên xuống là một dự án lớn cho các bộ dữ liệu nhỏ hơn.Vì các dự án lớn cũng tốn kém hơn, nó đắt nhất về tiền bạc và nhân lực.Nếu kho dữ liệu được hoàn thành và duy trì, đó là một bộ sưu tập rộng lớn, chứa mọi thứ mà công ty biết.hoàn thành.Ngoài ra, mối tương quan giữa các mart dữ liệu chỉ mạnh mẽ như cách sử dụng của chúng làm cho chúng.Nếu một mối tương quan mạnh mẽ tồn tại, nhưng không có người dùng nào nhìn thấy nó, nó không được kết nối.