Skip to main content

Canonicalization là gì?

Từ

Canonical có nghĩa là một cái gì đó phù hợp với một tiêu chuẩn được chấp nhận.Canonicalization mdash;hoặc Canonicalisation trong tiếng Anh Anh mdash;là quá trình theo đó một cái gì đó được đưa vào phù hợp với tiêu chuẩn được chấp nhận.Trong lĩnh vực của máy tính, thuật ngữ Canonical hóa được sử dụng để chỉ các tiêu chuẩn đáp ứng trong một số lĩnh vực khác nhau.Nó thường được coi là vấn đề, khi nó thực sự là giải pháp cho nhiều vấn đề khác nhau.Vì đó là một từ dài như vậy, Canonicalization được viết tắt bằng cách sử dụng các chữ cái đầu tiên và cuối cùng của nó và số lượng chữ cái ở giữa: C14N.Nó đề cập đến địa chỉ người gửi email, xây dựng tên tệp, mã hóa chuỗi trong Unicode, để sử dụng XML (ngôn ngữ đánh dấu mở rộng) và xây dựng URL (trình định vị tài nguyên thống nhất).Trong mọi trường hợp, vấn đề là khả năng cho nhiều định dạng đại diện cho cùng một mục, với chính thức hóa là cách để thống nhất và tiêu chuẩn hóa. lấy XML làm ví dụ.XML cho phép thay đổi cú pháp.Điều này có nghĩa là hai tài liệu không giống hệt nhau có thể có cùng dạng chính tắc, và do đó tương đương về mặt chức năng.Thông số kỹ thuật XML chính tắc được thiết kế để giải quyết vấn đề này bằng cách thiết lập một phương pháp theo đó danh tính của các tài liệu riêng biệt có thể được thiết lập.Phương pháp tạo biểu mẫu chính tắc cho bất kỳ tài liệu XML nào đã cho được gọi là Phương pháp Canonicalization XML

Đối với Canonical hóa URL, ý tưởng là đề cập đến một trang web cụ thể một cách nhất quán bởi một URL.Ví dụ đơn giản nhất là hai phiên bản của trang chủ, một trong số đó có ba w và một phiên bản khác không:

http: //www.wisegeek.com

versus

http: // wisegeek.com

Đây là một vấn đề đối với SEO (tối ưu hóa công cụ tìm kiếm) vì nó phân chia các báo cáo về lưu lượng truy cập, tất cả đều thực sự đi đến cùng một nơi.Kết quả là trang web có nhiều URL cho cùng một trang dường như hoạt động kém hơn so với thực tế. Có những vấn đề khác ngoài w

s.Chúng bao gồm các dấu gạch chéo và sự khác biệt giữa các phiên bản URL với các chữ cái trên và chữ thường.Matt Cutts của Google® khuyên bạn nên giải quyết vấn đề này bằng cách sử dụng chuyển hướng vĩnh viễn (301) của tất cả các URL thay thế cho URL bạn muốn, cho phép các công cụ tìm kiếm đánh giá đó là URL chính tắc.