Skip to main content

Cos'è la semplice regressione lineare?

Una semplice regressione lineare si applica alle statistiche e aiuta a descrivere i dati (x, y) che sembra avere una relazione lineare, consentendo una previsione di y se x è noto.Questi dati sono spesso tracciati su grafici a dispersione e la formula per la regressione lineare crea una linea che si adatta meglio a tutti i punti, a condizione che abbiano veramente una correlazione lineare.Non si adatterà esattamente a tutti i punti, ma dovrebbe essere una linea in cui la somma dei quadrati della differenza tra dati effettivi e dati previsti (residui) crea il numero più basso, che è spesso chiamato linea o linea dei minimi quadrati diil più adatto.L'equazione della riga per i dati del campione e i dati della popolazione sono le seguenti: ŷ ' b 0 + b 1 x e y ' b 0 + b 1 x.

Chiunque abbia familiarità con Algebra può notare ilLa somiglianza di questa linea a y ' mx + b, e in effetti i due sono relativamente identici, tranne i due termini sul lato destro dell'equazione, in modo che B 1 sia uguale a pendenza o m.Il motivo di questo riarrangiamento è che diventa quindi elegantemente facile aggiungere termini aggiuntivi con caratteristiche come esponenti che potrebbero descrivere diverse forme di relazione non lineari.

Le formule per ottenere una semplice linea di regressione lineare sono relativamente complesse e ingombranti, e la maggior parte delle persone lo faNon passare molto tempo a scriverli perché impiegano molto tempo a completare.Invece, vari programmi, come per Excel O per molti tipi di calcolatori scientifici, può facilmente calcolare una linea dei minimi quadrati.La linea è appropriata per la previsione solo se vi è una chiara evidenza di una forte correlazione tra gli insiemi di dati (x, y).Un calcolatore genererà una linea, indipendentemente dal fatto che abbia senso usarla.

Allo stesso tempo viene generata una semplice equazione della linea di regressione lineare, le persone devono esaminare il livello di correlazione.Ciò significa valutare R, il coefficiente di correlazione, rispetto a una tabella di valori per determinare se esiste una correlazione lineare.Inoltre, valutare i dati tracciandoli come un diagramma a dispersione è un buon modo per avere una sensazione se i dati hanno una relazione lineare.

Ciò che può quindi essere fatto con una semplice linea di regressione lineare, a condizione che abbia una correlazione lineare, è che valoriPuò essere sostituito in X, per ottenere un valore previsto per ŷ.Questa previsione ha i suoi limiti.I dati presenti, in particolare se si tratta solo di un campione, possono avere una correlazione lineare ora, ma potrebbero non essere in seguito aggiunti con materiale campione aggiuntivo.

Alternativamente, un intero campione può condividere una correlazione mentre un'intera popolazione no.La previsione è quindi limitata e andare ben oltre i valori dei dati disponibili è chiamato estrapolazione e non è incoraggiata.Inoltre, le persone dovrebbero sapere che se non esiste alcuna correlazione lineare, la migliore stima di X è la media di tutti i dati Y.

In sostanza, una semplice regressione lineare è uno strumento statistico utile che può, con discrezione, essere utilizzato per prevedere i valori ŷ basati su un valore x.Viene quasi sempre insegnato con l'idea di correlazione lineare poiché determinare l'utilità di una linea di regressione richiede l'analisi di R.Fortunatamente con molti moderni programmi tecnici, le persone possono graficamente i grafici a dispersione, aggiungere linee di regressione e determinare il coefficiente di correlazione R con un paio di voci.