Skip to main content

Bộ dữ liệu là gì?

Một tập dữ liệu là một tập hợp các dữ liệu liên quan được thu thập từ một nguồn duy nhất.Thuật ngữ này có một số ứng dụng, từ thông tin được tổng hợp từ kết quả khảo sát đến tập hợp kết quả nghiên cứu khoa học.Trong lĩnh vực máy tính và Internet, một tập dữ liệu là một nhóm các số hoặc byte, thường được hiển thị trong một bảng với các cột phân loại dữ liệu thành các tập hợp con.Có một số loại bộ dữ liệu, bao gồm phương thức truy cập lưu trữ tuần tự, phân vùng và ảo (VSAM). Các bộ dữ liệu cung cấp cái nhìn sâu sắc về một chủ đề hoặc khái niệm cụ thể.Họ lưu trữ thông tin mà các ứng dụng hoặc hệ điều hành cần hoạt động chính xác.Các hệ thống tiêu biểu bao gồm thư viện vĩ mô, chương trình nguồn và tham số hệ thống hoặc biến.Các bộ này có thể được liệt kê để chúng có thể được gọi bằng một tên dễ hiểu mà không cần tham khảo khu vực lưu trữ cụ thể. Các chương trình cho cơ sở dữ liệu thông tin như bảo hiểm hoặc hồ sơ y tế cũng có thể sử dụng các bộ dữ liệu.Chương trình chạy trên hệ thống lưu trữ thông tin trong các bộ dữ liệu.Một số bộ dữ liệu này chứa văn bản có thể đọc có thể được tạo thành các báo cáo.Các loại hồ sơ này thường được gọi là đơn vị và chúng được phân loại theo một mã định danh duy nhất, chẳng hạn như tên khách hàng hoặc tên bệnh nhân. Bộ dữ liệu được tổ chức theo số lượng và tần suất và phương thức mà chúng sẽ được truy cập.Định dạng của các bộ dữ liệu riêng lẻ cũng phụ thuộc vào dự định sử dụng thông tin.Các loại dữ liệu khác nhau là khác biệt, nhưng có nhiều điểm tương đồng trong số đó.Phương pháp này được sử dụng thường xuyên nhất cho thông tin được tổ chức bằng số hoặc bảng chữ cái.Để truy cập một mục từ bộ dữ liệu tuần tự, hệ thống cần phải đi qua các mục đi trước nó trong bất kỳ hệ thống tổ chức nào đã được lập trình. Các bộ dữ liệu được phân vùng cho phép truy cập trực tiếp hơn vào các mục.Phương pháp này được sử dụng khi có một lượng lớn thông tin, chẳng hạn như cơ sở dữ liệu rộng rãi về địa chỉ hoặc thông tin khách hàng.Những bộ dữ liệu này còn được gọi là thư viện.Thông tin được tổ chức theo cách hơi giống với phương pháp tuần tự, mặc dù có sự khác biệt trong phương pháp truy cập thông tin. Phương thức truy cập lưu trữ ảo (VSAM) là một tập dữ liệu được giải trình tự (KSDS).Các bộ dữ liệu này được lưu trữ với thông tin tìm kiếm cụ thể được đính kèm với từng mục để mỗi mục có thể được truy cập nhanh hơn.Hệ thống này là tốt nhất cho các bộ dữ liệu được sử dụng theo cách không thể đoán trước và với tần số cao.