Skip to main content

การถดถอยเชิงเส้นง่าย ๆ คืออะไร?

การถดถอยเชิงเส้นแบบง่าย ๆ ใช้กับสถิติและช่วยอธิบายข้อมูล (x, y) ที่ดูเหมือนจะมีความสัมพันธ์เชิงเส้นเพื่อให้การคาดการณ์ของ y บางอย่างหากเป็นที่รู้จัก xข้อมูลนี้มักจะถูกพล็อตบน scatterplots และสูตรสำหรับการถดถอยเชิงเส้นสร้างบรรทัดที่เหมาะกับทุกจุดที่ดีที่สุดหากพวกเขามีความสัมพันธ์เชิงเส้นอย่างแท้จริงมันจะไม่พอดีกับทุกจุด แต่ควรเป็นบรรทัดที่ผลรวมของกำลังสองของความแตกต่างระหว่างข้อมูลจริงและข้อมูลที่คาดหวัง (ส่วนที่เหลือ) สร้างจำนวนต่ำสุดซึ่งมักเรียกว่าเส้นสี่เหลี่ยมน้อยที่สุดพอดีดีที่สุดสมการของบรรทัดสำหรับข้อมูลตัวอย่างและข้อมูลประชากรมีดังต่อไปนี้: ŷ ' b 0 + b 1 x และ y ' b 0 + b 1 x.ความคล้ายคลึงกันของบรรทัดนี้เป็น y ' mx + b และในความเป็นจริงทั้งสองนั้นค่อนข้างเหมือนกันยกเว้นคำสองคำที่ด้านขวาของสมการจะถูกสลับดังนั้น B

1

เท่ากับความชันหรือ mเหตุผลสำหรับการจัดเรียงใหม่นี้คือมันกลายเป็นเรื่องง่ายที่จะเพิ่มคำเพิ่มเติมด้วยคุณสมบัติเช่นเลขชี้กำลังที่อาจอธิบายรูปแบบความสัมพันธ์ที่ไม่เชิงเส้นที่แตกต่างกันสูตรสำหรับการได้รับสายการถดถอยเชิงเส้นแบบง่าย ๆ ค่อนข้างซับซ้อนและยุ่งยากและคนส่วนใหญ่ทำไม่ใช้เวลามากในการเขียนสิ่งเหล่านี้เพราะพวกเขาใช้เวลานานกว่าจะเสร็จสมบูรณ์แทนโปรแกรมต่าง ๆ เช่นสำหรับ Excel reg;หรือสำหรับเครื่องคิดเลขทางวิทยาศาสตร์หลายประเภทสามารถคำนวณเส้นกำลังสองน้อยที่สุดได้อย่างง่ายดายบรรทัดนั้นเหมาะสมสำหรับการทำนายหากมีหลักฐานที่ชัดเจนของความสัมพันธ์ที่แข็งแกร่งระหว่างชุดข้อมูล (x, y)เครื่องคิดเลขจะสร้างสายโดยไม่คำนึงว่ามันเหมาะสมที่จะใช้หรือไม่

ในเวลาเดียวกันมีการสร้างสมการเส้นการถดถอยเชิงเส้นแบบง่าย ๆ หรือไม่ผู้คนจะต้องดูระดับความสัมพันธ์ซึ่งหมายถึงการประเมิน R, ค่าสัมประสิทธิ์สหสัมพันธ์, กับตารางของค่าเพื่อตรวจสอบว่ามีความสัมพันธ์เชิงเส้นหรือไม่นอกจากนี้การประเมินข้อมูลโดยการพล็อตเป็น scatterplot เป็นวิธีที่ดีในการรับรู้หากข้อมูลมีความสัมพันธ์เชิงเส้น

สิ่งที่สามารถทำได้ด้วยเส้นการถดถอยเชิงเส้นแบบง่าย ๆสามารถทดแทนเป็น X เพื่อรับค่าที่คาดการณ์ไว้สำหรับŷการทำนายนี้มีข้อ จำกัดข้อมูลที่มีอยู่โดยเฉพาะอย่างยิ่งหากเป็นเพียงตัวอย่างอาจมีความสัมพันธ์เชิงเส้นในขณะนี้ แต่อาจไม่ได้เพิ่มวัสดุตัวอย่างเพิ่มเติมในภายหลัง

สลับกันตัวอย่างทั้งหมดสามารถแบ่งปันความสัมพันธ์ในขณะที่ประชากรทั้งหมดไม่ได้การทำนายจึงมี จำกัด และไปไกลเกินกว่าค่าข้อมูลที่มีอยู่เรียกว่าการคาดการณ์และไม่ได้รับการสนับสนุนยิ่งไปกว่านั้นผู้คนควรรู้ว่าหากไม่มีความสัมพันธ์เชิงเส้นอยู่การประมาณการที่ดีที่สุดของ X คือค่าเฉลี่ยของข้อมูล Y ทั้งหมด

โดยพื้นฐานแล้วการถดถอยเชิงเส้นแบบง่ายเป็นเครื่องมือทางสถิติที่มีประโยชน์ซึ่งสามารถใช้ดุลยพินิจในการทำนายค่าŷตามค่า xมันมักจะสอนด้วยความคิดของความสัมพันธ์เชิงเส้นเนื่องจากการกำหนดประโยชน์ของสายการถดถอยต้องมีการวิเคราะห์ Rโชคดีที่มีโปรแกรมทางเทคนิคที่ทันสมัยมากมายผู้คนสามารถกราฟกราฟสเทคได้เพิ่มสายการถดถอยและกำหนดค่าสัมประสิทธิ์สหสัมพันธ์ R ด้วยสองรายการ