Skip to main content

Hvad er en kasseplot?

Et kasseplot eller boks-og-whisker-diagram er en metode til at organisere numeriske data langs en enkelt talelinje, som enten kan være vandret eller lodret.Den faktiske boks, når plottet er vandret, sidder lidt over nummerlinjen og består af tre lodrette linjer, der er forbundet sammen med vandrette linjer.De horisontale grænser for boksen repræsenterer de første og tredje kvartiler (25. og 75. percentiler), adskilt af den midterste linje, som er datas median eller 50. percentil.På hver side af boksen plot fra midten af de vandrette linjer strækker lodrette linjer, nogle gange kaldet whiskers,.Når disse når minimum og maksimalt antal af datasættet, ender de i mindre vandrette linjer, skønt dette kan variere lidt afhængigt af dataspredning.

Der er nogle vigtige elementer, der udgør en god kasseplot, og nogle tal, som folk har brug forat vide, hvornår de opretter disse diagrammer.Den første af disse kaldes sammendrag af fem nummer, ofte forkortet som fem num.sum.Dette er en liste over første og tredje kvartiler, median og minimum og maksimalt antal af dataene.I nogle applikationer bliver folk nødt til at liste disse i nærheden af plottet, skønt analyse af et plot med en lang række linje også kan udlede disse tal ved at se på de tre vandrette linjer og de afsluttende whiskers.Det er ikke et kylling/æg -spørgsmål til den person, der tegner et plot, fordi de fem numre.sum.Skal bruges til at oprette plottet.

Folk har også brug for at kende et tal kaldet Interquartile Range (IQR).At trække den første kvartil fra den tredje kvartil henter IQR, og ved hjælp af forskellige software eller videnskabelige regnemaskiner kan også få dette nummer og det fem nummeroversigt ved at indtaste alle data.IQR er vigtig, fordi linjer, der strækker sig fra boksen, normalt kun strækker sig til 1,5 gange IQR.Data ud over dette punkt er angivet med prikker i stedet for en kontinuerlig linje.Disse prikker antyder ofte, at dataene har outliers.

Der findes en række forskellige anvendelser til kasseplottet.Flere grunde kan trækkes over et tallinje og kan sammenligne lignende sæt data, der er differentieret med en vigtig faktor.For eksempel kan forskere eller statistikere muligvis registrere hjerterytme for mænd og kvinder og derefter konstruere to stablede kasseplaner for at se efter betydelige forskelle i rækkevidde og kvartiler.

Boks plotter adresser ikke datafrekvens.Manglen på en yderligere skala (lodret eller vandret) udelader information om gentagelse af tal, datasætstørrelse og de fleste individuelle tal.Den person, der ser på en kasseplot, vil mest forstå det samlede antal fem nummer, rækkevidde, og om dataene har nogen outliers.Boksstørrelse, forholdet mellem median og kvartiler og whiskers længde kan vise, om data er skæve, men det kan ikke tale med ting som middel, tilstand eller standardafvigelse.Andre diagrammer som histogrammer kan være mere nyttige, når folk ønsker at repræsentere ting som frekvens eller udlede bedre visuals om datafordeling.