Skip to main content

Co je to jednoduchá lineární regrese?

Jednoduchá lineární regrese se vztahuje na statistiky a pomáhá popsat data (x, y), která se zdá, že mají lineární vztah, což umožňuje určitou předpověď Y, pokud je známa x.Tato data jsou často vykreslena na rozptylu a vzorec pro lineární regresi vytváří linii, která nejlépe vyhovuje všem bodům, pokud mají skutečně lineární korelaci.To se nehodí přesně na všechny body, ale měla by to být řádek, kde součet čtverců rozdílu mezi skutečnými daty a očekávanými údaji (zbytky) vytváří nejnižší číslo, které se často nazývá linie nejmenších čtverců nebo linienejlépe fit.Rovnice řádku pro údaje o vzorcích a údaje o populaci jsou následující: ŷ ' B 0 + B 1 x a y ' B 0 + B 1 X.

Každý, kdo je obeznámen s algebrouPodobnost tohoto řádku s y ' mx + b a ve skutečnosti jsou tyto dva relativně identické, s výjimkou dvou termínů na pravé straně rovnice se přepíná, takže b 1 se rovná svahu nebo m.Důvodem tohoto přeskupení je to, že se pak stává elegantně snadné přidat další termíny s funkcemi, jako jsou exponenty, které by mohly popsat různé nelineární formy vztahu.Nestrávíte mnoho času zapisováním, protože to trvá dlouho.Místo toho různé programy, například pro Excel Nebo pro mnoho typů vědeckých kalkulaček, můžete snadno vypočítat linii nejmenších čtverců.Linka je vhodná pouze pro predikci, pokud existuje jasný důkaz silné korelace mezi sadami dat (x, y).Kalkulačka vygeneruje čáru, bez ohledu na to, zda má smysl ji používat.To znamená hodnocení R, korelační koeficient, proti tabulce hodnot, aby se určilo, zda existuje lineární korelace.Navíc hodnocení dat jejich vynesením jako rozptylu je dobrým způsobem, jak získat smysl, pokud mají data lineární vztah.Lze nahradit do x, aby se získala předpovídaná hodnota pro ŷ.Tato předpověď má své limity.Přítomné údaje, zejména pokud se jedná pouze o vzorek, mohou mít nyní lineární korelaci, ale nemusí později s přidáním dalšího vzorkového materiálu.Predikce je proto omezená a přesahující dostupné hodnoty dat se nazývá extrapolace a není podporována.Navíc, pokud by lidé věděli, že pokud neexistuje lineární korelace, nejlepším odhadem X je průměr všech dat Y.

V zásadě je jednoduchá lineární regrese užitečným statistickým nástrojem, který lze s uvážením použít k predikci ŷ hodnot založených na hodnotě x.Téměř vždy se učí myšlenkou lineární korelace, protože stanovení užitečnosti regresní linie vyžaduje analýzu r.Naštěstí s mnoha moderními technickými programy mohou lidé grafovat rozptyly, přidat regresní linie a určit korelační koeficient R s několika záznamy.