Skip to main content

Co to jest prosta regresja liniowa?

Prosta regresja liniowa dotyczy statystyk i pomaga opisać dane (x, y), które wydają się mieć związek liniowy, umożliwiając pewne przewidywanie y, jeśli x jest znane.Dane te są często wykreślane na wykresach rozrzutu, a formuła regresji liniowej tworzy linię, która najlepiej pasuje do wszystkich punktów, pod warunkiem, że naprawdę mają korelację liniową.Nie pasuje dokładnie do wszystkich punktów, ale powinna być linią, w której suma kwadratów różnicy między rzeczywistymi danymi a oczekiwanymi danymi (reszty) tworzy najniższą liczbę, która jest często nazywana linią lub linią kwadratów lub liniiNajlepsze dopasowanie.Równanie linii dla danych przykładowych i danych populacji są następujące: ŷ ' b

0 + b 1 x i y ' b 0 + b 1 x.

Każdy, kto zna algebrę, może zwrócić uwagę na algebręPodobieństwo tej linii do y ' mx + b, a w rzeczywistości dwa są stosunkowo identyczne, z wyjątkiem dwóch terminów po prawej stronie równania, tak że b

1 równa się nachyleniu lub m.Powodem tego przegrupowania jest to, że staje się elegancko łatwe do dodania dodatkowych terminów z takimi funkcjami, jak wykładnicy, które mogą opisywać różne nieliniowe formy związku.

Formuły uzyskania prostej linii regresji liniowej są stosunkowo złożone i uciążliwe, a większość ludzi to robiNie spędzaj dużo czasu na zapisywaniu ich, ponieważ zajmuje dużo czasu.Zamiast tego różne programy, takie jak Excel i Reg;lub dla wielu rodzajów kalkulatorów naukowych może łatwo obliczyć linię najmniejszych kwadratów.Linia jest odpowiednia do przewidywania tylko wtedy, gdy istnieją wyraźne dowody silnej korelacji między zestawami danych (x, y).Kalkulator wygeneruje linię, niezależnie od tego, czy ma sens jej użycie.

Jednocześnie generowane jest proste równanie linii regresji liniowej, ludzie muszą patrzeć na poziom korelacji.Oznacza to ocenę R, współczynnik korelacji, w stosunku do tabeli wartości w celu ustalenia, czy istnieje korelacja liniowa.Ponadto ocena danych poprzez wykreślenie ich jako wykresu rozrzutu jest dobrym sposobem na uzyskanie sensu, jeśli dane mają związek liniowy.

Co można zrobić za pomocą prostej linii regresji liniowej, pod warunkiem, że ma one korelację liniową, że wartości to wartości, które wartości sąmożna zastąpić x, aby uzyskać przewidywaną wartość ŷ.Ta prognoza ma swoje granice.Dane obecne, szczególnie jeśli są to tylko próbka, mogą mieć teraz korelację liniową, ale mogą nie później z dodatkowym materiałem próbki.

Alternatywnie cała próbka może dzielić korelację, podczas gdy cała populacja nie.Prognozowanie jest zatem ograniczone, a wykraczanie daleko poza dostępne wartości danych nazywa się ekstrapolacją i nie jest zachęcana.Ponadto ludzie powinni wiedzieć, że jeśli nie istnieje korelacja liniowa, najlepszym oszacowaniem x jest średnia wszystkich danych Y.

Zasadniczo prosta regresja liniowa jest użytecznym narzędziem statystycznym, które z dyskrecją można użyć do przewidywania wartości ŷ na podstawie wartości x.Prawie zawsze jest nauczany z ideą korelacji liniowej, ponieważ określanie przydatności linii regresji wymaga analizy r.Na szczęście w przypadku wielu nowoczesnych programów technicznych ludzie mogą wykazywać wykresy rozrzutu, dodawać linie regresji i określać współczynnik korelacji R z kilkoma wpisami.