Skip to main content

Vad är histogramfördelning?

Histogramfördelning i statistik hänvisar till mönster, former och platser för univariata datastänger på ett histogram.Hur och var staplarna distribueras kan användas för att analysera och dra slutsatser om uppgifterna.Histogramfördelningsanalys är viktig för att identifiera egenskaper som datanormalitet, multimodala distributioner och skevdata.

Ett histogram är en univariat datavisning som använder rektanglar proportionella i område till klass eller binfrekvenser för att visuellt visa funktioner i data.Datapunkterna i histogrammet är organiserade i fack och själva histogramfördelningen är en visuell tillnärmning av datasfrekvensfördelning eller sannolikhetsdensitetsfunktion.Formen på distributionen kan ändras baserat på antalet fack.

Histogramfördelningsanalys används ofta som en kvalitativ kontroll för datanormalitet.Även om analysmetoder för att bestämma normalitet finns, kan histogram användas för att ge en snabb, sunt förnuft för att spara tid.Om histogramdata visas ungefär jämnt och centrerade på medelvärdet antas data vara normala.Även om det är snabbt och relativt enkelt, är denna typ av kvalitativ kontroll subjektiv och analysmetoder bör användas om en högre standard för noggrannhet krävs.

Att bestämma om en datamängd uppvisar skevhet är ett annat sätt histogramfördelningsanalys kan användas.Data Skewness definieras som uttalad asymmetri i data.Negativt skev, eller skev till vänster, ses i datamängder med mycket få låga värden.Positivt skev, eller skevning till höger, förekommer i datamängder med få höga värden.Iakttagande av histogramfördelningen kan avslöja outliers och skevdata.

Förutom att avslöja egenskaperna hos data med ett enda läge, kan formen på ett histogram också avslöja egenskaper hos multimodala data.Multimodala datauppsättningar innehåller mer än ett läge och kännetecknas av frekvensfördelningar som har mer än en topp eller maxima.Politiska tillhörigheter i en stad, omröstningar för godkännande av yttrande och kroppsstorlekar är exempel på datamängder som kan vara multimodala.Att observera formen på histogrammet och notera de olika topparna i multimodala data kan ofta ge en forskare mer insikt än enkla univariata statistiska beräkningar skulle.

Analysen av histogram och distributionen av data är mycket beroende av de valda binstorlekarna.I praktiken kan antalet fack uppskattas genom att ta kvadratroten för antalet observationer, även om andra fackstorlekar kan användas.Till exempel kan en lärare välja att analysera testkvaliteter genom att välja fackstorlekar som återspeglar bokstavsbetyg.