Skip to main content

Phân phối sai lệch là gì?

Một phân phối sai lệch đề cập đến phân phối xác suất không đồng đều và không đối xứng trong tự nhiên.Không giống như một phân phối bình thường tiêu chuẩn, giống như một đường cong chuông trong hình dạng, các phân phối sai lệch được dịch chuyển sang một bên, sở hữu một đuôi dài hơn ở một bên so với phía bên kia của trung vị.Mặt khác của đường cong sẽ có một đỉnh các giá trị được phân cụm trong đó phần lớn các điểm dữ liệu xảy ra.Loại đường cong phân phối này thường được phân loại là có độ lệch dương hoặc độ lệch âm, tùy thuộc vào hướng dịch chuyển đường cong. Nói chung, phân phối sai lệch được cho là có độ lệch dương nếu đuôi của đường cong dài hơnphía bên phải khi so sánh với phía bên trái.Phân phối sai lệch này cũng được gọi là sai lệch sang bên phải vì phía bên phải sở hữu phần mở rộng của các điểm dữ liệu.Các đường cong lệch dương sở hữu số lượng giá trị lớn nhất về phía bên trái của đường cong. Ngược lại, các phân phối sai lệch tiêu cực có nhiều điểm dữ liệu nhất ở phía bên phải của đường cong.Những đường cong này có đuôi dài hơn ở bên trái, vì vậy chúng được cho là bị lệch sang trái.Một quy tắc quan trọng trong việc xác định hướng sai lệch là xem xét chiều dài của đuôi hơn là vị trí của giá trị trung bình hoặc trung bình.Điều này là do độ lệch cuối cùng được gây ra bởi các giá trị xa nhất xa nhất, kéo dài đường cong ra phía bên đó của biểu đồ.

Hiểu các thuộc tính của phân phối sai lệch là rất quan trọng trong nhiều ứng dụng thống kê.Nhiều người cho rằng dữ liệu theo đường cong chuông hoặc phân phối bình thường, vì vậy họ cũng cho rằng biểu đồ không có độ lệch.Tuy nhiên, các giả định này có thể dẫn họ giải thích sai thông tin về phân phối thực tế. Một phân phối sai lệch vốn đã không đồng đều trong tự nhiên, do đó, nó sẽ không tuân theo các mẫu bình thường tiêu chuẩn như độ lệch chuẩn.Các phân phối bình thường liên quan đến một độ lệch chuẩn áp dụng cho cả hai bên của đường cong, nhưng phân phối sai lệch sẽ có các giá trị độ lệch chuẩn khác nhau cho mỗi bên của đường cong.Điều này là do hai bên không phải là hình ảnh phản chiếu của nhau, vì vậy các phương trình mô tả một bên không thể được áp dụng cho bên kia.Giá trị độ lệch chuẩn thường lớn hơn đối với bên với đuôi dài hơn vì có sự lan truyền dữ liệu rộng hơn ở phía đó khi so sánh với đuôi ngắn hơn.