Skip to main content

Phân phối biểu đồ là gì?

Phân phối biểu đồ trong Thống kê đề cập đến các mẫu, hình dạng và vị trí của các thanh dữ liệu đơn biến trên biểu đồ.Làm thế nào và nơi các thanh được phân phối có thể được sử dụng để phân tích và rút ra kết luận về dữ liệu.Phân tích phân phối biểu đồ rất quan trọng trong việc xác định các đặc điểm như tính quy phạm dữ liệu, phân phối đa phương thức và dữ liệu sai lệch. Biểu đồ là một màn hình dữ liệu đơn biến sử dụng hình chữ nhật theo tỷ lệ theo khu vực với tần số hoặc bin để hiển thị các tính năng trực quan của dữ liệu.Các điểm dữ liệu trong biểu đồ được tổ chức thành các thùng và bản thân phân phối biểu đồ là một xấp xỉ trực quan của phân phối tần số dữ liệu hoặc hàm mật độ xác suất.Hình dạng của phân phối có thể thay đổi dựa trên số lượng thùng. Phân tích phân phối biểu đồ thường được sử dụng làm kiểm tra định tính về tính quy tắc dữ liệu.Mặc dù các phương pháp phân tích để xác định tính quy phạm tồn tại, biểu đồ có thể được sử dụng để cung cấp kiểm tra nhanh, thông thường để tiết kiệm thời gian.Nếu dữ liệu biểu đồ xuất hiện gần đúng và tập trung vào giá trị trung bình, dữ liệu được coi là bình thường.Mặc dù nhanh và tương đối dễ dàng, loại kiểm tra định tính này là phương pháp chủ quan và phân tích nên được sử dụng nếu cần có tiêu chuẩn chính xác cao hơn.

Xác định xem một tập dữ liệu có thể sử dụng sự sai lệch là một cách khác có thể sử dụng phân tích phân phối biểu đồ hay không.Độ lệch dữ liệu được định nghĩa là sự bất đối xứng rõ rệt trong dữ liệu.Độ lệch âm, hoặc độ lệch ở bên trái, được nhìn thấy trong các tập dữ liệu với rất ít giá trị thấp.Skew tích cực hoặc độ lệch sang bên phải, xảy ra trong các tập dữ liệu với một vài giá trị cao.Quan sát phân phối biểu đồ có thể tiết lộ các ngoại lệ và dữ liệu sai lệch. Ngoài việc tiết lộ các đặc điểm của dữ liệu với một chế độ duy nhất, hình dạng của biểu đồ cũng có thể tiết lộ các đặc điểm của dữ liệu đa phương thức.Các bộ dữ liệu đa phương thức chứa nhiều hơn một chế độ và được đặc trưng bởi các phân phối tần số có nhiều hơn một đỉnh hoặc cực đại.Các liên kết chính trị trong một thị trấn, các cuộc thăm dò ý kiến phê duyệt và kích thước cơ thể của ong là ví dụ về các bộ dữ liệu có thể là đa phương thức.Quan sát hình dạng của biểu đồ và lưu ý các đỉnh khác nhau trong dữ liệu đa phương thức thường có thể cung cấp cho một nhà nghiên cứu hiểu biết sâu sắc hơn so với các tính toán thống kê đơn biến đơn giản sẽ. Phân tích biểu đồ và phân phối dữ liệu phụ thuộc nhiều vào kích thước thùng được chọn.Trong thực tế, số lượng thùng có thể được ước tính bằng cách lấy căn bậc hai của số lượng quan sát, mặc dù các kích thước thùng khác có thể được sử dụng.Ví dụ, một giáo viên có thể chọn phân tích các lớp kiểm tra bằng cách chọn các kích thước thùng phản ánh các lớp thư.