Vad är histogramfördelning?

Histogramfördelning i statistik hänvisar till mönster, former och platser för univariata datastänger på ett histogram. Hur och var staplarna är distribuerade kan användas för att analysera och dra slutsatser om uppgifterna. Histogramfördelningsanalys är viktig för att identifiera egenskaper såsom datanormalitet, multimodala distributioner och skevdata.

Ett histogram är en univariat datavisning som använder rektanglar proportionella i område till klass eller binfrekvenser för att visuellt visa funktioner hos data. Datapunkterna i histogrammet är organiserade i fack och själva histogramfördelningen är en visuell tillnärmning av datas frekvensfördelning eller sannolikhetsdensitetsfunktion. Formen på distributionen kan ändras baserat på antalet fack.

histogramfördelningsanalys används ofta som en kvalitativ kontroll för datanormalitet. Även om analysmetoder för att bestämma normalitet finns, kan histogram användas för att ge en snabb, sunt förnuft för att spara tid. Om histogramdata visas ungefär jämnt och centrerade på medelvärdet antas data vara normala. Även om det är snabbt och relativt enkelt, är denna typ av kvalitativ kontroll subjektiv och analysmetoder bör användas om en högre noggrannhetsstandard krävs.

Att bestämma om en datamängd uppvisar skevhet är ett annat sätt att histogramfördelningsanalys kan användas. Data Skewness definieras som uttalad asymmetri i data. Negativt skev, eller skev till vänster, ses i datamängder med mycket få låga värden. Positivt skev, eller skevning till höger, förekommer i datamängder med få höga värden. Att observera histogramfördelningen kan avslöja outliers och skevdata.

Förutom att avslöja egenskaperna hos data med ett enda läge, kan formen på ett histogram också avslöja egenskaper hos multimodala data. Multimodala datauppsättningar innehåller mer än ett läge och är teckenized av frekvensfördelningar som har mer än en topp eller maxima. Politiska tillhörigheter i en stad, omröstningar för godkännande av yttrande och kroppsstorlekar är exempel på datamängder som kan vara multimodala. Att observera formen på histogrammet och notera de olika topparna i multimodala data kan ofta ge en forskare mer insikt än enkla univariata statistiska beräkningar skulle.

Analysen av histogram och distributionen av data är mycket beroende av de valda fackstorlekarna. I praktiken kan antalet fack uppskattas genom att ta kvadratroten för antalet observationer, även om andra fackstorlekar kan användas. Till exempel kan en lärare välja att analysera testkvaliteter genom att välja binstorlekar som återspeglar bokstavsbetyg.

Vad är histogramfördelning?

ANDRA SPRÅK

RELATERADE ARTIKLAR

Hur kan vi hjälpa?