Skip to main content

Hva er en bokseplott?

Et boks-plot eller boks-og-vispediagram er en metode for å organisere numeriske data langs en enkelt tallinje, som kan være enten horisontalt eller vertikalt.Selve boksen, når plottet er horisontalt, sitter litt over tallinjen og består av tre vertikale linjer, koblet sammen med horisontale linjer.De horisontale grensene for boksen representerer den første og tredje kvartilen (25. og 75. prosentiler), atskilt med midtlinjen, som er dataens median eller 50. persentil.På hver side av boksen plottet fra midten av de horisontale linjene, strekker vertikale linjer, noen ganger kikket vispere.Når disse når minimums- og maksimumstall for datasettet, ender de i mindre horisontale linjer, selv om dette kan variere litt avhengig av datadespredning.

Det er noen viktige elementer som utgjør en god bokseplott, og noen tall som folk trengerå vite når de lager disse diagrammer.Den første av disse kalles sammendraget av fem nummer, ofte forkortet som fem Num.sum.Dette er en liste over første og tredje kvartil, median og minimum og maksimum antall data.I noen applikasjoner vil folk trenge å liste opp disse nær plottet, selv om analyse av et plott med en god talllinje også kan utlede disse tallene ved å se på de tre horisontale linjene og de avsluttende vispene.Det er ikke et kylling/egg -spørsmål for personen som tegner et tomt fordi de fem numrene.sum.må brukes til å lage plottet.

Folk trenger også å vite et tall som heter Interquartile Range (IQR).Å trekke fra den første kvartilen fra den tredje kvartilen stammer IQR, og ved å bruke forskjellige programvare eller vitenskapelige kalkulatorer kan også få dette nummeret og sammendraget på fem nummer ved å legge inn alle data.IQR er viktig fordi linjer som strekker seg fra boksen vanligvis bare strekker seg til 1,5 ganger IQR.Data utover dette punktet er indikert med prikker i stedet for en kontinuerlig linje.Disse prikkene antyder ofte at dataene har outliers.

Det finnes en rekke bruksområder for boksen.Flere tomter kan trekkes over en talllinje, og kan sammenligne lignende datasett differensiert med en viktig faktor.For eksempel kan forskere eller statistikere registrere hjertefrekvens for menn og kvinner, og deretter konstruere to stablede boksplott for å se etter betydelige forskjeller i rekkevidde og kvartiler.

.Mangelen på en ekstra skala (vertikal eller horisontal) utelater informasjon om gjenta tall, datasettstørrelse og de fleste individuelle tall.Personen som ser på en boks -plot vil mest forstå det fem antall sammendrag, rekkevidde og om dataene har noen outliers.Bokstørrelse, forhold til median til kvartiler og lengde på vispere kan vise om data er skjevt, men det kan ikke snakke til ting som middel, modus eller standardavvik.Andre diagrammer som histogrammer kan være mer nyttige når folk ønsker å representere ting som frekvens eller utlede bedre visuals om datadistribusjon.