Skip to main content

Các công cụ khai thác dữ liệu là gì?

Các công cụ khai thác dữ liệu là các thành phần phần mềm và lý thuyết cho phép người dùng trích xuất thông tin từ dữ liệu.Các công cụ cung cấp cho các cá nhân và công ty khả năng thu thập một lượng lớn dữ liệu và sử dụng nó để đưa ra quyết định về một người dùng hoặc nhóm người dùng cụ thể.Một số cách sử dụng phổ biến nhất của các công cụ khai thác dữ liệu là trong các lĩnh vực tiếp thị, bảo vệ gian lận và giám sát.Việc trích xuất thủ công dữ liệu đã tồn tại trong hàng trăm năm.Tuy nhiên, việc tự động hóa khai thác dữ liệu đã phổ biến nhất kể từ buổi bình minh của thời đại máy tính.Trong thế kỷ 20, nhiều ngành khoa học máy tính đã xuất hiện để giúp hỗ trợ khái niệm phát triển các công cụ khai thác dữ liệu.Mục tiêu tổng thể của việc sử dụng các công cụ là khám phá các mẫu ẩn.Ví dụ, nếu một công ty tiếp thị thấy rằng một người có chuyến đi hàng tháng từ thành phố New York đến Los Angeles, thì công ty đó sẽ có lợi cho việc quảng cáo chi tiết về điểm đến cho cá nhân.Trong ngành khai thác dữ liệu, các tiêu chuẩn đã được thiết lập để xác định các tham số của việc sử dụng các công cụ khai thác dữ liệu.Hàng năm, Hiệp hội máy tính của máy tính nhóm lợi ích đặc biệt về khám phá kiến thức và khai thác dữ liệu (SIGKDD) tổ chức một cuộc họp để xác định các quy trình nào được sử dụng.Cùng một nhóm cũng chịu trách nhiệm đánh giá ý nghĩa đạo đức của việc phân tích dữ liệu từ các cá nhân và công ty.Một tạp chí hai năm được xuất bản bởi nhóm có tựa đề

thám hiểm SIGKDD.KDD được phát triển vào năm 1989 bởi Gregory Piatetsky-Shapiro.Sử dụng công cụ khai thác dữ liệu này, người dùng có thể xử lý dữ liệu thô, khai thác dữ liệu để biết thông tin và giải thích các kết quả khác nhau dưới dạng quản lý thông tin.Một trong những hình thức quan trọng nhất của các công cụ khai thác dữ liệu được sử dụng để chống khủng bố trong thế kỷ 21.Tại Hoa Kỳ, Hội đồng nghiên cứu quốc gia sử dụng các khái niệm khai thác mẫu và khai thác dữ liệu dựa trên chủ đề để xác định hoạt động khủng bố trong nhóm thông tin lớn trên toàn thế giới.Khai thác mẫu được xác định bởi quá trình định vị các mẫu trong một khối lượng lớn dữ liệu.Các nỗ lực khai thác dữ liệu dựa trên chủ đề để xác định mối quan hệ giữa các cá nhân.Cả hai kỹ thuật cũng có thể được sử dụng trong thực tiễn kinh doanh chung bằng cách xác định suy nghĩ của cơ sở khách hàng và mối quan hệ tương tác giữa khách hàng.