Skip to main content

Khai thác kho dữ liệu là gì?

Khai thác kho dữ liệu là phân tích thông tin có trong một hoặc nhiều cơ sở dữ liệu để làm cho thông tin hữu ích.Các cơ sở dữ liệu này, hoặc kho dữ liệu, là một lưu ký trung tâm cho dữ liệu.Các công ty tổng hợp thông tin họ thu thập trên khách hàng của họ trong kho dữ liệu.Khi thông tin đã được thu thập, nó được khai thác và thông tin hữu ích được trích xuất từ nó để tạo ra thông tin có thể giúp công ty đưa ra quyết định kinh doanh sẽ tăng lợi nhuận hoặc giảm chi phí.Các nhà bán lẻ thường sử dụng khai thác kho dữ liệu để phân tích và dự đoán hành vi của khách hàng của họ.Ví dụ, khi một người mua sắm đi đến siêu thị và cung cấp cho nhân viên thu ngân thẻ người mua sắm thường xuyên của cô ấy, thông tin về việc mua hàng của cô ấy được thu thập và lưu trữ trong kho dữ liệu của Công ty.Một chuỗi siêu thị sẽ có hàng triệu dữ liệu về những gì mọi người mua, khi nào, với số lượng và giá nào.Một cửa hàng có thể biết rằng 50.000 gói đậu Hà Lan đông lạnh đã được bán vào năm ngoái, nhưng thông tin đó không đặc biệt hữu ích.Tuy nhiên, nếu việc khai thác kho dữ liệu tiết lộ, 75% đậu Hà Lan đông lạnh đó đã được bán trong nhiều tháng khi đậu Hà Lan không có sẵn, hoặc 10% đậu Hà Lan đã được bán trong hai tuần dẫn đến Lễ Tạ ơn, công ty có thểĐể sử dụng thông tin đó để tăng doanh số hàng năm của đậu Hà Lan đông lạnh.Các công ty có thể sử dụng các kỹ thuật khai thác kho dữ liệu để dự đoán doanh số bán hàng trong tương lai.Khai thác dữ liệu cũng có thể giúp họ ước tính tác động của các quyết định thả và giá cả.Tại siêu thị, khai thác dữ liệu có thể khiến các cửa hàng không còn hết đậu trong trường hợp đậu Hà Lan tươi trong một năm nhất định.Hồi quy khai thác dữ liệu là một kỹ thuật khai thác dữ liệu được sử dụng để hiển thị những gì có khả năng xảy ra với giá trị dữ liệu nếu có thứ gì đó trong phương trình được thay đổi.Sử dụng ví dụ siêu thị, hồi quy sẽ dự đoán mức độ bán đậu đông lạnh nếu đậu mới tăng giá.Hồi quy sử dụng dữ liệu lịch sử và áp dụng một công thức cho nó, dự đoán hành vi trong tương lai. Các công ty thường sẽ sử dụng ứng dụng phần mềm khai thác kho dữ liệu để thu thập và khai thác dữ liệu của họ.Ứng dụng chính xác được xác định bởi lượng dữ liệu họ có và loại phân tích họ muốn làm.Chọn công cụ khai thác dữ liệu chính xác là rất quan trọng để thu thập và giải thích dữ liệu hữu ích.