Skip to main content

Hva er en ikke -parametrisk test?

En ikke -parametrisk test er en type statistisk hypotesetesting som ikke antar en normalfordeling.Av denne grunn blir ikke-parametriske tester noen ganger referert til som distribusjonsfrie.En ikke -parametrisk test er mer robust enn en standardtest, krever generelt mindre prøver, er mindre sannsynlig å bli påvirket av utliggende observasjoner og kan brukes med færre forutsetninger.På den annen side kan ikke -parametriske tester være mindre effektive enn deres standard kolleger, spesielt hvis befolkningen virkelig er distribuert.Ikke -parametrisk testing er spesielt effektivt for spørsmål som omhandler frekvenser og proporsjoner.

Standard hypotesetesting sammenligner en prøve fra en testpopulasjon med en prøve fra en kontrollpopulasjon for å avgjøre om testpopulasjonen er statistisk sammenlignbar med kontrollpopulasjonen.Hvis forskjellen mellom prøveparameteren eller parametere og mdash;Vanligvis gjennomsnittlig og/eller varians mdash;er stor nok, da kan testprøven vurderes å være forskjellig fra kontrollpopulasjonen.Slik parametrisk testing krever at parametrene kommer fra en normalfordeling.

Det er matematisk bevist at en prøvestørrelse på 30 eller flere vil oppføre seg omtrent som en normalfordeling, så dette kravet antas generelt.Hvis forutsetningen ikke er berettiget, kan det hende at resultatene av testingen ikke er gyldige.Ikke -parametrisk testing unngår denne antagelsen.

I stedet undersøker ikke -parametrisk hypotesetesting ofte data enten ved å kategorisere den eller ved å bestille den.Hvis utvalget og kontrollpopulasjonene er de samme, og hvis dataene ble samlet riktig, er noen forskjeller mellom kategoriene eller rangeringene strengt tatt resultatene av tilfeldighetene.Hvis sannsynligheten for at disse forskjellene kunne ha skjedd ved tilfeldig sjanse, også kalt en p-verdi, er mindre enn en valgt betydelig sannsynlighet, vanligvis enten 5 prosent eller 1 prosent, avviser testeren hypotesen om at prøven og kontrollpopulasjonene er denSamme og konkluderer med at de er forskjellige.

En vanlig ikke-parametrisk test er en chi-kvadrat-test, brukt for å sammenligne observerte frekvenser eller proporsjoner.Når bare ett sett med frekvenser blir undersøkt, kalles dette ofte en godhetstest og brukes til å bestemme om de observerte frekvensene passer innenfor området som kan forventes.For eksempel kan en godhet-av-fit-test brukes til å bestemme om en roulettebord hadde blitt rigget ved å sammenligne tabellresultater med resultatene som sannsynlighetsteorien forutsier eller for å avgjøre om en hodepine medisin var effektiv ved å sammenligne andelen personer hvis hodepineForbedret medisinen til andelen mennesker hvis hodepine forbedret seg da de tok placebo.Hvis to frekvenser blir undersøkt, kan den ikke-parametriske chi-square ikke-parametriske testen brukes til å teste for korrelasjon eller uavhengighet mellom faktorer.Politiske avstemmere ser ofte etter sammenheng mellom sosiale, økonomiske eller demografiske faktorer og politisk tro, for eksempel å se om det er en sammenheng mellom en persons utdanning og om han eller hun godkjenner hvordan en valgt tjenestemann presterer.

En annen ikke -parametrisk test er denWilcoxon rangeringssumtest, som vanligvis brukes i de samme situasjonene som standard parametrisk hypotesetesting.I stedet for å undersøke gjennomsnittet av hver prøve, undersøker imidlertid Wilcoxon -testen rangering av hver verdi hvis de to prøvene er bestilt fra minst til størst.Hvis de to prøvene er de samme, bør hver gruppe spredes jevnt gjennom rangeringen.Hvis en gruppe er gruppert i den nedre eller øvre enden av rangeringen, indikerer dette at de to gruppene er forskjellige.

Anta for eksempel at noen ønsket å avgjøre om animerte filmer er lengre eller kortere enn ikke-animerte filmer.For en standardtest vil han eller hun bestemme den gjennomsnittlige DUrasjon for et utvalg av animerte filmer og for et utvalg av live-action-filmer og sammenligne forskjellen med variansen av prøvene.For Wilcoxon -ikke -parametriske testen blir filmtidene satt i orden fra minst til største, og rekkene til de animerte filmtidene er summert.

Personen kan beregne sannsynligheten for at rangeringssummen vil være den størrelsen eller mindre ved å bestemme antall mulige bestillinger med en gitt rangsum og det totale antallet mulige bestilling, en beregning som er enkel gitt nok beregningsstyrke for brute kraft.Med to små prøver av seks filmer hver, er det allerede 924 mulige arrangementer av rangeringer, et tall som raskt vokser mye større etter hvert som filmer blir lagt til.Alternativt er det publiserte tabeller som gir sannsynligheter som tilsvarer gitte rangeringssummer for gitte prøvestørrelser.Disse finnes i statistikktekster eller online.

Ikke -parametrisk testing er et voksende felt.Det kan brukes i et hvilket som helst felt der mer konvensjonell statistikk også har blitt brukt.Bruksområder er spesielt vanlige i samfunnsvitenskap og medisin, men spesielt når normalfordeling ikke kan gjelde.