Skip to main content

Hvad er skævt distribution?

En skæv fordeling henviser til en sandsynlighedsfordeling, der er ujævn og asymmetrisk.I modsætning til en standard normal distribution, der ligner en klokkekurve i form, forskydes skæve fordelinger til den ene side, hvilket har en længere hale på den ene side i forhold til den anden side af medianen.Den anden side af kurven vil have en klynget top af værdier, hvor størstedelen af datapunkter opstår.Denne type distributionskurve klassificeres normalt som at have enten et positivt skævt eller et negativt skævt, afhængigt af retningen på kurveskiftet.

Generelt siges en skæv fordeling at have positivt skævhed, hvis kurvens hale er længere tændtHøjre side sammenlignet med venstre side.Denne skæve distribution omtales også som skæv til højre, fordi højre side besidder den bredere udvidelse af datapunkter.Positive skæve kurver har det største antal værdier mod venstre side af kurven. I modsætning hertil har negativt skæve fordelinger de fleste datapunkter på højre side af kurven.Disse kurver har længere haler på venstre sider, så de siges at være skæve til venstre.En vigtig regel til bestemmelse af skævhedens retning er at overveje halens længde snarere end placeringen af middelværdien eller medianen.Dette skyldes, at skævheden i sidste ende er forårsaget af de længste afgrænsede værdier, der strækker kurven ud mod den side af grafen.

At forstå egenskaberne ved en skæv fordeling er vigtig i mange statistiske anvendelser.Mange mennesker antager, at data følger en klokkekurve eller normal distribution, så de antager også, at en graf har nul skævhed.Disse antagelser kunne imidlertid føre dem til at fejlagtigt fortolke oplysninger om den faktiske distribution.

En skæv fordeling er i sig selv ujævn, så det vil ikke følge standard normale mønstre såsom standardafvigelse.Normale fordelinger involverer en standardafvigelse, der gælder for begge sider af kurven, men skæve fordelinger vil have forskellige standardafvigelsesværdier for hver side af kurven.Dette skyldes, at de to sider ikke er spejlbilleder af hinanden, så ligningerne, der beskriver den ene side, kan ikke anvendes på den anden.Standardafvigelsesværdien er generelt større for siden med den længere hale, fordi der er en bredere spredning af data på den side sammenlignet med den kortere hale.