Hva er enkel lineær regresjon?

Enkel lineær regresjon gjelder statistikk og hjelper til med å beskrive (x, y) data som ser ut til å ha et lineært forhold, noe som gir mulighet for en viss prediksjon av y hvis x er kjent. Disse dataene er ofte plottet på scatterplots, og formelen for lineær regresjon skaper en linje som best passer alle poengene, forutsatt at de virkelig har en lineær korrelasjon. Det passer ikke nøyaktig alle punktene, men det skal være en linje der summen av rutene for forskjellen mellom faktiske data og forventede data (rester) skaper det laveste antallet, som ofte kalles den minste kvadrater -linjen eller linjen med best passform. Ligningen av linjen for prøvedata og populasjonsdata er følgende: ŷ = b _{0 + b 1 x og y = b _{0 + b _{1 x.}}}

Alle som er kjent med algebra, kan merke likheten mellom denne linjen med y = mx + b, og faktisk er de to relativt identiske, bortsett fra de to begrepene på høyre side av ligningen blir byttet, slik at b _{1 tilsvarer bakkinge eller m. Årsaken til denne omorganiseringen er at den da blir elegant enkel å legge til flere vilkår med funksjoner som eksponenter som kan beskrive forskjellige ikke -lineære former for forhold.}

Formlene for å få en enkel lineær regresjonslinje er relativt kompliserte og tungvint, og de fleste bruker ikke mye tid på å skrive disse ned fordi de tar lang tid å fullføre. I stedet kan forskjellige programmer, for eksempel for Excel® eller for mange typer vitenskapelige kalkulatorer, lett beregne en minste firkantelinje. Linjen er bare passende for prediksjon hvis det er klare bevis på en sterk sammenheng mellom settene med (x, y) data. En kalkulator vil generere en linje, uavhengig av om det er fornuftig å bruke den.

Samtidig genereres en enkel lineær regresjonslinje -ligning, folk må se på korrelasjonsnivå. Dette betyr å evaluere R, korrelenationskoeffisient, mot en tabell med verdier for å bestemme om lineær korrelasjon eksisterer. I tillegg er det en god måte å få en mening å evaluere dataene ved å plotte dem som en scatterplot hvis data har et lineært forhold.

Det som deretter kan gjøres med en enkel lineær regresjonslinje, forutsatt at den har en lineær korrelasjon, er at verdier kan erstattes med x, for å få en forutsagt verdi for ŷ. Denne prediksjonen har sine grenser. Dataene som er til stede, spesielt hvis det bare er et utvalg, kan ha en lineær korrelasjon nå, men kanskje ikke senere med ekstra prøvemateriale lagt til.

Alternativt kan en hel prøve dele en korrelasjon mens en hel befolkning ikke gjør det. Prediksjon er derfor begrenset, og å gå langt utover de tilgjengelige dataverdiene kalles ekstrapolering, og blir ikke oppmuntret. Skulle folk vite at hvis det ikke eksisterer noen lineær korrelasjon, er det beste estimatet av X gjennomsnittet av alle Y -data.

I hovedsak er enkel lineær regresjon en nyttig statistisk tOOL som med skjønn kan brukes til å forutsi ŷ verdier basert på en X -verdi. Det blir nesten alltid lært med ideen om lineær korrelasjon siden bestemmelse av nytten av en regresjonslinje krever analyse av r. Heldigvis med mange moderne tekniske programmer, kan folk tegne spredningsplotter, legge til regresjonslinjer og bestemme korrelasjonskoeffisient R med et par oppføringer.

Hva er enkel lineær regresjon?

ANDRE SPRÅK