Skip to main content

Ano ang simpleng linear regression?

Ang simpleng linear regression ay nalalapat sa mga istatistika at tumutulong upang ilarawan ang (x, y) na data na tila may isang linear na relasyon, na nagpapahintulot sa ilang hula ng y kung ang x ay kilala.Ang data na ito ay madalas na naka -plot sa mga scatterplots at ang pormula para sa linear regression ay lumilikha ng isang linya na pinakamahusay na umaangkop sa lahat ng mga puntos, sa kondisyon na sila ay tunay na may isang linear correlation.Hindi ito magkasya nang eksakto sa lahat ng mga puntos, ngunit dapat itong isang linya kung saan ang kabuuan ng mga parisukat ng pagkakaiba sa pagitan ng aktwal na data at inaasahang data (nalalabi) ay lumilikha ng pinakamababang bilang, na madalas na tinatawag na hindi bababa sa linya ng mga parisukat o linya ngPinakamahusay na akma.Ang equation ng linya para sa sample data at data ng populasyon ay ang mga sumusunod: ŷ ' b 0 + b 1 x at y ' b 0 + b 1 x.

Ang sinumang pamilyar sa algebra ay maaaring tandaan angAng pagkakapareho ng linya na ito sa y ' mx + b, at sa katunayan ang dalawa ay medyo magkapareho, maliban sa dalawang termino sa kanang bahagi ng equation ay nakabukas, upang ang b 1 ay katumbas ng slope o m.Ang dahilan para sa muling pagsasaayos na ito ay pagkatapos ito ay nagiging madali madaling magdagdag ng mga karagdagang termino na may mga tampok tulad ng mga exponents na maaaring ilarawan ang iba't ibang mga nonlinear form ng relasyon.Hindi gumugol ng maraming oras sa pagsulat ng mga ito dahil matagal na silang nakumpleto.Sa halip, ang iba't ibang mga programa, tulad ng para sa Excel o para sa maraming uri ng mga pang -agham na calculator, madaling makalkula ang hindi bababa sa linya ng mga parisukat.Ang linya ay angkop lamang para sa hula kung may malinaw na katibayan ng isang malakas na ugnayan sa pagitan ng mga hanay ng (x, y) na data.Ang isang calculator ay bubuo ng isang linya, anuman ang kahulugan nito na gamitin ito.Nangangahulugan ito na suriin ang R, ang koepisyent ng ugnayan, laban sa isang talahanayan ng mga halaga upang matukoy kung umiiral ang linear correlation.Bilang karagdagan, ang pagsusuri ng data sa pamamagitan ng pag -plot nito bilang isang pagkakalat ay isang mahusay na paraan ng pagkuha ng isang kahulugan kung ang data ay may isang linear na relasyon.maaaring mapalitan sa x, upang makakuha ng isang hinulaang halaga para sa ŷ.Ang hula na ito ay may mga limitasyon.Ang data na naroroon, lalo na kung ito ay isang sample lamang, ay maaaring magkaroon ng isang linear correlation ngayon, ngunit maaaring hindi mamaya na may karagdagang halimbawang materyal na idinagdag.

kahalili, ang isang buong sample ay maaaring magbahagi ng isang ugnayan habang ang isang buong populasyon ay hindi.Ang hula ay samakatuwid ay limitado, at ang lampas sa magagamit na mga halaga ng data ay tinatawag na extrapolation, at hindi hinihikayat.Bukod dito, dapat bang malaman ng mga tao na kung walang linear correlation na umiiral, ang pinakamahusay na pagtatantya ng x ay ang ibig sabihin ng lahat ng data ng Y.

Mahalaga, ang simpleng linear regression ay isang kapaki -pakinabang na tool sa istatistika na maaaring, na may pagpapasya, ay gagamitin upang mahulaan ang mga halaga batay sa isang halaga ng x.Ito ay halos palaging itinuro sa ideya ng linear correlation dahil ang pagtukoy ng pagiging kapaki -pakinabang ng isang linya ng regression ay nangangailangan ng pagsusuri ng R.Sa kabutihang palad na may maraming mga modernong teknikal na programa, ang mga tao ay maaaring mag -graph ng mga scatterplots, magdagdag ng mga linya ng regression at matukoy ang koepisyent ng ugnayan R na may ilang mga entry.