Skip to main content

Hvad er histogramklasser?

Histogramklasser er områder af værdier, der indeholder datapunkter i en frekvensfordeling eller tabulering af rå data.De omtales også som intervaller, bakker eller skraldespand.I et histogram, en type søjlediagram, er disse klasser afbildet som lodrette søjler, hvor højden på kolonnen angiver antallet af datapunkter, der er indeholdt i klasseområdet.Typisk foretages valget af histogramklasse for at forbedre den visuelle repræsentation af datastatistikker eller tendenser.

Når der er en stor mængde data at vise, er et histogram især nyttigt til at skildre formen af dens distribution.En hel række data er opdelt i intervaller, og antallet af datapunkter, der falder ind i hver, tælles for at give klassefrekvensen.Området eller bredden af intervallet bestemmer antallet af histogramklasser og påvirker formen på grafen.

Hvis intervallet er for bredt, kan betydelige oplysninger udelades af klasserne, der er for inkluderende.Når valget af intervalbredde er for smal, kan lav klassefrekvens muligvis give unødig betydning for det, der faktisk er en tilfældig variation.Der er flere metoder til at indstille et passende antal histogramklasser til et datasæt.

I henhold til Sturgiss -regel skal antallet af klasser være tæt på basis 2 -loggen over antallet af datapunkter plus en.Ved hjælp af Rices -regel skal antallet af definerede klasser være dobbelt så meget som terningens rod af antallet af datapunkter.Uanset hvilken metode der bruges til at vælge antallet af histogramklasser, bør flere forskellige bredder forsøges at teste følsomheden af histogramformen for klassestørrelse.Det korrekte antal klasser er det, der mest nøjagtigt skildrer fordelingen af dataene.

Med det rigtige antal histogramklasser for en række data, bør en meningsfuld grafisk repræsentation resultere, der muliggør klar fortolkning.Et histogram skal vise centrum og spredning af dataene, enhver skævhed eller dataasymmetri og outliers eller datapunkter, der forekommer uden for det forventede værdierområde.Tilstanden, eller hyppigst forekommende værdi, skal være synlige såvel som grupperinger, der kan indikere en multiple modalitet.Histogramanalyse kan også indikere fejl i dataindsamlingsprocessen.

Langt brugt i finansiering og samfundsvidenskaber, histogrammer bliver mere kendte i de grafiske udstillinger af forbrugerelektronik.Digital fotografering er især åben for deres anvendelse, hvor mange kameraer indeholder et farvehistogram for at indikere hvidbalance og eksponering.Et digitalt fotograferingshistogram kan også vise pixels som histogramklasser, der er afbildet mod grå nuancer.