Skip to main content

Hva er enkel lineær regresjon?

Enkel lineær regresjon gjelder statistikk og hjelper til med å beskrive (x, y) data som ser ut til å ha et lineært forhold, noe som gir mulighet for en viss prediksjon av y hvis x er kjent.Disse dataene er ofte plottet på scatterplots, og formelen for lineær regresjon skaper en linje som best passer alle poengene, forutsatt at de virkelig har en lineær korrelasjon.Det passer ikke nøyaktig alle punktene, men det skal være en linje der summen av rutene for forskjellen mellom faktiske data og forventede data (rester) skaper det laveste antallet, som ofte kalles den minste kvadrater -linjen eller linjen tilpasser best.Ligningen av linjen for prøvedata og populasjonsdata er følgende: ŷ ' b 0 + b 1 x og y ' b 0 + b 1 x.

Alle som er kjent med algebra kan merke segLikheten mellom denne linjen med y ' mx + b, og faktisk er de to relativt identiske, bortsett fra de to begrepene på høyre side av ligningen er byttet, slik at B 1 tilsvarer skråningen eller m.Årsaken til denne omorganiseringen er at den da blir elegant enkel å legge til flere vilkår med funksjoner som eksponenter som kan beskrive forskjellige ikke -lineære former for forhold.

Formler for å få en enkel lineær regresjonslinje er relativt kompliserte og tungvint, og de fleste gjørIkke bruk mye tid på å skrive disse ned fordi de tar lang tid å fullføre.I stedet forskjellige programmer, for eksempel for Excel eller for mange typer vitenskapelige kalkulatorer, kan enkelt beregne en minste firkantelinje.Linjen er bare passende for prediksjon hvis det er klare bevis på en sterk sammenheng mellom settene med (x, y) data.En kalkulator vil generere en linje, uavhengig av om det er fornuftig å bruke den.

Samtidig genereres en enkel lineær regresjonslinje -ligning, folk må se på korrelasjonsnivå.Dette betyr å evaluere R, korrelasjonskoeffisienten, mot en tabell med verdier for å avgjøre om lineær korrelasjon eksisterer.I tillegg er det en god måte å få en mening å evaluere dataene ved å plotte dem som en scatterplot.kan erstattes med x for å få en forutsagt verdi for ŷ.Denne prediksjonen har sine grenser.Dataene som er til stede, spesielt hvis det bare er et utvalg, kan ha en lineær korrelasjon nå, men kanskje ikke senere med ytterligere prøvemateriale lagt til.

Alternativt kan en hel prøve dele en korrelasjon mens en hel populasjon ikke gjør det.Prediksjon er derfor begrenset, og å gå langt utover de tilgjengelige dataverdiene kalles ekstrapolering, og blir ikke oppmuntret.Skulle folk vite at hvis det ikke eksisterer noen lineær korrelasjon, er det beste estimatet av X gjennomsnittet av alle Y -data.

I hovedsak er enkel lineær regresjon et nyttig statistisk verktøy som med skjønn kan brukes til å forutsi ŷ verdier basert på en x -verdi.Det blir nesten alltid lært med ideen om lineær korrelasjon siden bestemmelse av nytten av en regresjonslinje krever analyse av r.Heldigvis med mange moderne tekniske programmer, kan folk tegne spredningsplotter, legge til regresjonslinjer og bestemme korrelasjonskoeffisient R med et par oppføringer.