Skip to main content

Hva er histogramklasser?

Histogramklasser er verdier som inneholder datapunkter i en frekvensfordeling, eller tabulering av rå data.De blir også referert til som intervaller, binger eller søppelbredder.I et histogram, en type stolpediagram, er disse klassene avbildet som vertikale kolonner der høyden på kolonnen indikerer antall datapunkter i klasseområdet.Valg av histogramklasse er vanligvis gjort for å forbedre den visuelle representasjonen av datastatistikk eller trender.

Når det er en stor mengde data å vise, er et histogram spesielt nyttig for å skildre formen på distribusjonen.Et helt spekter av data brytes ned i intervaller, og antall datapunkter som faller i hver telles for å gi klassefrekvensen.Området, eller bredden, av intervallet bestemmer antall histogramklasser og påvirker formen på grafen.

Hvis intervallet er for bredt, kan betydelig informasjon utelates av at klassene er for inkluderende.Når valget av intervallbredde er for smal, kan lavklassefrekvens gi unødig betydning for det som faktisk er en tilfeldig variasjon.Det er flere metoder for å sette et passende antall histogramklasser for et datasett.

I henhold til Sturgiss -regelen, bør antallet klasser være i nærheten av basen 2 -loggen for antall datapunkter, pluss en.Ved å bruke RICE -regelen, bør antallet definert klasser være dobbelt så stor som kuberoten til antall datapunkter.Uansett hvilken metode som brukes for å velge antall histogramklasser, bør flere forskjellige bredder prøves å teste følsomheten til histogramformen til klassestørrelse.Riktig antall klasser er det som mest skildrer fordelingen av dataene.

Med riktig antall histogramklasser for en rekke data, bør en meningsfull grafisk representasjon resultere som muliggjør klar tolkning.Et histogram skal vise sentrum og spredning av dataene, all skeivhet eller dataasymmetri, og outliers, eller datapunkter som oppstår utenfor det forventede verdiene.Modus, eller hyppigst forekommende verdi, skal være tydelig så vel som grupperinger som kan indikere en multippel modalitet.Histogramanalyse kan også indikere feil i datainnsamlingsprosessen.

Lenge brukt i finans og samfunnsvitenskap, blir histogrammer mer kjent i de grafiske visningene av forbrukerelektronikk.Digital fotografering er spesielt åpen for bruken av dem, med mange kameraer som inneholder et fargehistogram for å indikere hvitbalanse og eksponering.Et digitalt fotograferingshistogram kan også vise piksler som histogramklasser plottet mot gråtoner.