Skip to main content

Biểu đồ hộp là gì?

Biểu đồ hộp hoặc sơ đồ hộp và whisker là một phương pháp để tổ chức dữ liệu số dọc theo một dòng số duy nhất, có thể là ngang hoặc dọc.Hộp thực tế, khi biểu đồ nằm ngang, nằm hơi cao hơn dòng số và bao gồm ba đường thẳng đứng, được kết nối với nhau bằng các đường ngang.Các ranh giới ngang của hộp đại diện cho các nhóm tứ phân vị thứ nhất và thứ ba (phần trăm thứ 25 và 75), được phân tách bằng đường giữa, đó là dữ liệu trung bình hoặc phần trăm thứ 50.Ở hai bên của biểu đồ hộp từ giữa các đường ngang, các đường thẳng đứng, đôi khi được gọi là râu ria, mở rộng.Khi chúng đạt đến số lượng tối thiểu và tối đa của tập dữ liệu, chúng kết thúc theo các đường ngang nhỏ hơn, mặc dù điều này có thể thay đổi một chút tùy thuộc vào dữ liệu.Để biết khi nào họ tạo ra các biểu đồ này.Đầu tiên trong số này được gọi là tóm tắt năm số, thường được viết tắt là năm num.Tổng.Đây là danh sách các nhóm tứ phân thứ nhất và thứ ba, trung bình và số lượng tối thiểu và tối đa của dữ liệu.Trong một số ứng dụng, mọi người sẽ cần liệt kê những thứ này gần cốt truyện, mặc dù phân tích một âm mưu với một dòng số tốt cũng có thể rút ra những con số này bằng cách nhìn vào ba dòng ngang và những bộ râu kết thúc.Nó không phải là một câu hỏi gà/trứng cho người vẽ một cốt truyện vì năm num.Tổng.phải được sử dụng để tạo ra cốt truyện.

Mọi người cũng cần biết một số gọi là phạm vi liên vùng (IQR).Trừ phần tư đầu tiên từ Bộ tứ thứ ba có được IQR và sử dụng các phần mềm hoặc máy tính khoa học khác nhau cũng có thể nhận được số này và tóm tắt năm số bằng cách nhập tất cả dữ liệu.IQR rất quan trọng vì các dòng kéo dài từ hộp thường chỉ kéo dài đến 1,5 lần IQR.Dữ liệu vượt quá điểm đó được biểu thị bằng các dấu chấm thay vì một dòng liên tục.Những dấu chấm này thường đề xuất dữ liệu có ngoại lệ.Một loạt các công dụng tồn tại cho lô hộp.Một số lô có thể được rút ra trên một dòng số và có thể so sánh các bộ dữ liệu tương tự được phân biệt bởi một số yếu tố quan trọng.Ví dụ, các nhà khoa học hoặc nhà thống kê có thể ghi nhận nhịp tim của nam và nữ, sau đó xây dựng hai ô hộp xếp chồng lên nhau để tìm kiếm sự khác biệt đáng kể về phạm vi và tứ phân vị.Việc thiếu một thang đo bổ sung (dọc hoặc ngang) bỏ qua thông tin về các số lặp lại, kích thước tập dữ liệu và hầu hết các số riêng lẻ.Người nhìn vào một biểu đồ hộp sẽ hiểu nhiều nhất về tóm tắt năm số, phạm vi và liệu dữ liệu có bất kỳ ngoại lệ nào không.Kích thước hộp, mối quan hệ của các bộ tứ trung bình với các bộ tứ và độ dài của râu ria có thể hiển thị liệu dữ liệu có bị sai lệch hay không, nhưng nó có thể nói với những thứ như ý nghĩa, chế độ hoặc độ lệch chuẩn.Các biểu đồ khác như biểu đồ có thể hữu ích hơn khi mọi người muốn đại diện cho những thứ như tần số hoặc có được hình ảnh tốt hơn về phân phối dữ liệu.