Skip to main content

Một dòng phù hợp nhất là gì?

Trong toán học, dòng phù hợp nhất là một dòng có thể được rút ra liên quan đến các điểm trong một biểu đồ phân tán dữ liệu.Các sơ đồ phân tán được thực hiện khi hai thuộc tính của một thứ gì đó có liên quan, như ngày và nhiệt độ cao trong ngày.Dòng phù hợp nhất mô tả tốt nhất các điểm trên một biểu đồ phân tán khi sự khác biệt trung bình giữa nơi đường được rút ra và điểm gần nhất là ít nhất.Điều này rất dễ kiểm tra với phương pháp bình phương ít nhất.Các phương trình đôi khi được sử dụng để mô tả các dòng là một hàm khi chỉ có một điểm sẽ liên quan đến một điểm trên đường phù hợp nhất.Điều quan trọng là phải hiểu rằng tất cả các dòng có độ dốc và đánh chặn.Độ dốc mô tả mức độ nhanh chóng thay đổi giữa hai mối quan hệ.Việc chặn mô tả một điểm khi một phần của mối quan hệ sẽ trở thành 0 nếu dòng được mở rộng đến điểm đó.Phát triển một dòng phù hợp tốt là hữu ích vì nó cho phép dự đoán được thực hiện khi dữ liệu không được trình bày.Nếu chỉ có hai điểm được vẽ chỉ có một dòng có thể được vẽ bằng một thước kẻ như một đường thẳng giữa hai điểm.Chỉ với hai điểm, dòng phù hợp nhất là chính xác và không cần phải kiểm tra.Bây giờ nó có thể hiển thị vị trí chính xác của một mối quan hệ sẽ hạ cánh giữa hai điểm.Hầu hết các sơ đồ phân tán có nhiều điểm, và sử dụng một thước kẻ để vẽ một dòng phù hợp nhất không còn là kỹ thuật thích hợp.Nếu mối quan hệ được coi là lần đầu tiên được đặt hàng thì dòng phù hợp nhất vẫn sẽ là một đường thẳng nhưng dòng này không phải chạm vào bất kỳ điểm nào.Phương thức bình phương nhỏ nhất sẽ xác định xem một dòng sẽ phù hợp với dữ liệu tốt hơn một dòng khác.Nó làm điều này bằng cách xem liệu sự khác biệt giữa mỗi điểm được vẽ và điểm mà dòng dự đoán là sự khác biệt nhỏ nhất có thể.Tính trung bình sự khác biệt cung cấp một số thể hiện mức độ phù hợp với dữ liệu.Các dòng khác có thể nhận được giá trị thấp hơn và trở thành dòng mới phù hợp nhất trong một quy trình gọi là hồi quy tuyến tính.Không phải mọi dòng là một đường thẳng, nhiều đường cong và thậm chí ba chiều.Hồi quy nhiều tuyến tính là kỹ thuật thống kê được sử dụng để tìm một dòng phù hợp nhất cho dữ liệu không theo một đường thẳng.Hồi quy đề cập đến đường cong và khớp bề mặt, nhưng ngay cả đối với những cách sử dụng khó khăn hơn nhiều của dòng phù hợp nhất, phương pháp bình phương ít nhất vẫn được sử dụng để kiểm tra và so sánh kết quả.