Skip to main content

Apa itu regresi linier sederhana?

Regresi linier sederhana berlaku untuk statistik dan membantu menggambarkan (x, y) data yang tampaknya memiliki hubungan linier, memungkinkan untuk beberapa prediksi y jika x diketahui.Data ini sering diplot pada scatterplots dan rumus untuk regresi linier menciptakan garis yang paling sesuai dengan semua poin, asalkan mereka benar -benar memiliki korelasi linier.Itu tidak akan cocok dengan semua poin, tetapi harus menjadi garis di mana jumlah kotak perbedaan antara data aktual dan data yang diharapkan (residu) menciptakan angka terendah, yang sering disebut garis atau garis kuadrat terkecilpaling cocok.Persamaan garis untuk data sampel dan data populasi adalah sebagai berikut: ŷ ' b 0 + b 1 x dan y ' b 0 + b 1 x.

Siapa pun yang akrab dengan aljabar dapat dicatatKesamaan garis ini dengan y ' mx + b, dan pada kenyataannya keduanya relatif identik, kecuali dua istilah di sisi kanan persamaan diaktifkan, sehingga b 1 sama dengan kemiringan atau m.Alasan untuk penataan ulang ini adalah kemudian menjadi elegan mudah untuk menambahkan istilah tambahan dengan fitur seperti eksponen yang mungkin menggambarkan berbagai bentuk hubungan nonlinier.

Rumus untuk mendapatkan garis regresi linier sederhana relatif kompleks dan rumit, dan kebanyakan orang melakukannyaTidak menghabiskan banyak waktu menuliskannya karena mereka membutuhkan waktu lama untuk menyelesaikannya.Sebaliknya, berbagai program, seperti untuk Excel Atau untuk banyak jenis kalkulator ilmiah, dapat dengan mudah menghitung garis kuadrat terkecil.Garis ini hanya sesuai untuk prediksi jika ada bukti yang jelas tentang korelasi yang kuat antara set data (x, y).Kalkulator akan menghasilkan garis, terlepas dari apakah masuk akal untuk menggunakannya.

Pada saat yang sama persamaan garis regresi linier sederhana dihasilkan, orang harus melihat tingkat korelasi.Ini berarti mengevaluasi R, koefisien korelasi, terhadap tabel nilai untuk menentukan apakah ada korelasi linier.Selain itu, mengevaluasi data dengan memplotnya sebagai scatterplot adalah cara yang baik untuk merasakan jika data memiliki hubungan linier.

Apa yang kemudian dapat dilakukan dengan garis regresi linier sederhana, asalkan memiliki korelasi linier, adalah bahwa nilai -nilai itudapat diganti menjadi X, untuk mendapatkan nilai yang diprediksi untuk ŷ.Prediksi ini memiliki batasannya.Data yang ada, terutama jika itu hanya sampel, mungkin memiliki korelasi linier sekarang, tetapi mungkin tidak dengan bahan sampel tambahan yang ditambahkan.

Bergantian, seluruh sampel dapat berbagi korelasi sementara seluruh populasi tidak.Oleh karena itu prediksi terbatas, dan jauh melampaui nilai data yang tersedia disebut ekstrapolasi, dan tidak didorong.Selain itu, jika orang tahu bahwa jika tidak ada korelasi linier, estimasi terbaik X adalah rata -rata dari semua data y.

Pada dasarnya, regresi linier sederhana adalah alat statistik yang berguna yang dapat, dengan kebijaksanaan, digunakan untuk memprediksi ŷ nilai berdasarkan nilai x.Hampir selalu diajarkan dengan gagasan korelasi linier karena menentukan kegunaan garis regresi memerlukan analisis r.Untungnya dengan banyak program teknis modern, orang dapat membuat grafik scatterplot, menambahkan garis regresi dan menentukan koefisien korelasi R dengan beberapa entri.