Skip to main content

Vad är skevdistribution?

En skevfördelning avser en sannolikhetsfördelning som är ojämn och asymmetrisk till sin natur.Till skillnad från en standard normalfördelning, som liknar en klockkurva i form, skiftas skeva fördelningar till ena sidan och har en längre svans på ena sidan relativt den andra sidan av medianen.Den andra sidan av kurvan kommer att ha en klusterad topp av värden där majoriteten av datapunkterna inträffar.Denna typ av distributionskurva klassificeras vanligtvis som att ha antingen en positiv skev eller ett negativt skev, beroende på riktningen för kurvorna skiftar.

Generellt sägs en skevdistribution ha positivt skev om svansen är längre på kurvanhöger sida jämfört med vänster sida.Denna skeva distribution kallas också skev till höger eftersom höger sida har den bredare förlängningen av datapunkter.Positiva skevningskurvor har det största antalet värden mot vänster sida av kurvan.

Däremot har negativt skeva fördelningar de flesta datapunkter på höger sida av kurvan.Dessa kurvor har längre svansar på vänster sidor, så de sägs vara sned till vänster.En viktig regel för att bestämma riktningen för skev är att ta hänsyn till svansens längd snarare än platsen för medelvärdet eller medianen.Detta beror på att skeven i slutändan orsakas av de längsta avlägsna värdena, som sträcker kurvan ut mot den sidan av grafen.

Att förstå egenskaperna för en skevfördelning är viktigt i många statistiska tillämpningar.Många antar att data följer en klockkurva eller normalfördelning, så de antar också att en graf har noll skevhet.Dessa antaganden kan emellertid leda dem till att tolka information om den faktiska distributionen.

En skevdistribution är i sig ojämnt i naturen, så det kommer inte att följa standard normala mönster som standardavvikelse.Normala fördelningar involverar en standardavvikelse som gäller båda sidor av kurvan, men skevfördelningar kommer att ha olika standardavvikelsevärden för varje sida av kurvan.Detta beror på att de två sidorna inte är spegelbilder av varandra, så ekvationerna som beskriver ena sidan kan inte tillämpas på den andra.Standardavvikelsevärdet är i allmänhet större för sidan med den längre svansen eftersom det finns en bredare spridning av data på den sidan jämfört med den kortare svansen.