Skip to main content

Bộ định vị tài nguyên thống nhất là gì?

Một trình định vị tài nguyên thống nhất, còn được biết đến bởi URL từ viết tắt, là một phương tiện chỉ định vị trí và phương thức truy cập của một đối tượng trên Internet.Nó bao gồm một sơ đồ hoặc tên giao thức mô tả cách truy cập đối tượng.Nó cũng bao gồm vị trí mạng, cùng với các định danh truy vấn và định danh phân đoạn tùy chọn.Một cách sử dụng rất phổ biến cho một URL là hướng trình duyệt đến một trang web.

Khái niệm ban đầu của một bộ định vị tài nguyên thống nhất đã phát triển vào đầu những năm 1990.Yêu cầu nhận xét (RFC) 1630 là tiêu chuẩn URL đầu tiên, được phát hành bởi Lực lượng đặc nhiệm kỹ thuật internet (IETF) vào năm 1994. Một tên không có vị trí hoặc phương thức truy cập liên quan được gọi là tên tài nguyên thống nhất (URN).Kết hợp hai khái niệm, thuật ngữ Định danh tài nguyên thống nhất (URI) đã ra đời.Một URI có thể là một danh tính URN, một địa chỉ URL hoặc cả hai.Nó thậm chí có thể đề cập đến một đối tượng hoàn toàn không dựa trên mạng. Trong giới kỹ thuật, thuật ngữ định vị tài nguyên thống nhất hiếm khi được sử dụng nữa MDash; URI được ưa thích.URL vẫn là một cái tên phổ biến với công chúng và báo chí, tuy nhiên.Thông số kỹ thuật URI mới nhất, được phát hành vào năm 2009 là RFC 3986, làm rõ các khái niệm URL, URN và URI.

Một trình định vị tài nguyên thống nhất bao gồm hai phần.Đầu tiên là tên của một sơ đồ URI, tiếp theo là một đại tràng.Một sơ đồ xác định giao thức hoặc phương thức khác được sử dụng để truy cập tài nguyên.Internet được chỉ định các số cơ quan (IANA) quản lý một danh sách dài các chương trình URI đã đăng ký.Giao thức vận chuyển siêu văn bản (HTTP), HTTP an toàn (HTTPS) và Giao thức vận chuyển tệp (FTP) có lẽ là phổ biến nhất.Nhiều sơ đồ chưa đăng ký cũng được sử dụng. Phần thứ hai của bộ định vị tài nguyên thống nhất là đặc trưng của sơ đồ và có thể bao gồm một số thành phần.Phần này của URL HTTP thường bắt đầu với www.Tiếp theo là một tên miền.Địa chỉ giao thức Internet (IP) số có thể được sử dụng thay cho tên miền.Tên có thể được theo sau bởi đường dẫn đến một đối tượng cụ thể.Một chuỗi truy vấn, tên của một đoạn tiêu đề đoạn trong đối tượng hoặc cả hai cũng có thể có mặt. Khi nhập URL của trang web vào trình duyệt, sơ đồ và một phần của tên miền thường là tùy chọn.Nếu bị bỏ lại, http: // hoặc http: // www.thường sẽ được giả định bởi trình duyệt web.Đường dẫn, truy vấn hoặc đoạn cũng có thể chứa các ký tự đặc biệt hạn chế ở dạng số thập lục phân.Một không gian mdash;%20 mdash; là nơi được sử dụng phổ biến nhất.Một định danh tài nguyên quốc tế hóa (IRI) cũng cho phép các ký tự Unicode trong suốt.

Nhiều hơn một trình định vị tài nguyên thống nhất duy nhất có thể mô tả một đường dẫn đến cùng một đối tượng.Các công cụ tìm kiếm có thể sử dụng một quy trình gọi là chuẩn hóa URL để xác định xem nhiều URL có thực sự đề cập đến cùng một điều hay không.Trình duyệt web và trình thu thập thông tin cũng làm điều này là tốt.Một URL cũng có thể chỉ vào một đối tượng không thể tìm thấy mdash; nó di chuyển hoặc không bao giờ tồn tại để bắt đầu.