Halaman

    Social Items

URI là gì? Cấu trúc chi tiết của URI

URI(Uniform Resource Identifier) là một chuỗi các ký tự xác định tài nguyên logic hoặc vật lý. Số nhận dạng tài nguyên chung được chỉ định trong Request for Comments(RFC) 3986 của Internet Engineering Task Force(IFC) và được tóm tắt, mở rộng trong tài liệu cho kiến trúc web của W3C, kiến trúc của World Wide Web(WWW), Tập 1. Theo thông số kỹ thuật, tài nguyên này không nhất thiết phải truy cập trên Internet. Ví dụ tài liệu điện tử, cảm biến cửa thang máy, không gian tên XML, trang web và vi mạch.

Có hai loại URI đó là Uniform Resource Identifiers(URL)Uniform Resource Names (URN).

Uniform Resource Locator(URL) - loại URI này bắt đầu bằng cách nêu rõ giao thức nào sẽ được sử dụng để định vị và truy cập tài nguyên vật lý hoặc logic trên minternet. Ví dụ, nếu tài nguyên là một trang web, URI sẽ bắt đầu với giao thức HTTP. Nếu tài nguyên là một tệp, URI sẽ bắt đầu với giao thức FTP hoặc nếu tài nguyên là địa chỉ email, URI sẽ bắt đầu với giao thức mailto.

Uniform Resource Name(URN) – loại URI này không nêu rõ giao thức nào sẽ được sử dụng để định vị và truy cập tài nguyên; nó chỉ đơn giản gắn nhãn tài nguyên với một định danh duy nhất không phụ thuộc vào vị trí. URN sẽ xác định tài nguyên trong suốt vòng đời của nó và sẽ không bao giờ thay đổi. Mỗi URN có ba thành phần: nhãn 'urn', một dấu hai chấm và một chuỗi ký tự đóng vai trò là một định danh duy nhất.

Cấu trúc của chung của URI

Dạng chung của bất kỳ URI nào: scheme:[//[user:password@]host[:port]][/]path[?query][#fragment]

Scheme: Lược đồ đưa ra cú pháp cụ thể và bất kỳ giao thức liên quan nào cho URI. Các lược đồ không phân biệt chữ hoa chữ thường và được theo sau bởi dấu hai chấm.

Mặc dù hai dấu gạch chéo hiển thị trong ví dụ trên được yêu cầu bởi một số scheme, nhưng chúng không được yêu cầu bởi tất cả các scheme, bao gồm các thành phần thẩm quyền, được mô tả bên dưới.

Authority component: Thành phần quyền lực được tạo thành từ nhiều phần: phần xác thực tùy chọn, máy chủ lưu trữ - bao gồm tên đã đăng ký hoặc địa chỉ IP - và số cổng tùy chọn. Phần xác thực chứa tên người dùng và mật khẩu, được phân tách bằng dấu hai chấm và theo sau là ký hiệu cho tại (@). Sau khi @ đến tên máy chủ, lần lượt theo sau là dấu hai chấm và sau đó là số cổng. Điều quan trọng cần lưu ý là các địa chỉ IPv4 phải ở dạng ký hiệu thập phân và các địa chỉ IPv6 phải được đặt trong ngoặc.

Đường dẫn chứa dữ liệu được ký hiệu bằng một chuỗi các phân đoạn được phân tách bằng dấu gạch chéo. Đường dẫn phải bắt đầu bằng một dấu gạch chéo nếu có phần thẩm quyền. Nó cũng có thể bắt đầu bằng một dấu gạch chéo ngay cả khi không có phần quyền, nhưng nó không thể bắt đầu bằng dấu gạch chéo kép. Hãy nhớ rằng mặc dù phần cú pháp này có thể gần giống với một đường dẫn tệp cụ thể, nhưng nó không phải lúc nào cũng ngụ ý một mối quan hệ với đường dẫn hệ thống tệp đó.

Query(optional): Truy vấn chứa một chuỗi dữ liệu không phân cấp. Mặc dù cú pháp không được xác định rõ, nhưng nó thường là một chuỗi các cặp giá trị thuộc tính được phân tách bằng dấu phân cách, chẳng hạn như dấu và hoặc dấu chấm phẩy. Truy vấn được phân tách từ phần trước bằng dấu chấm hỏi.

Fragment(optional): Đoạn chứa định danh đoạn cung cấp hướng đến tài nguyên thứ cấp. Ví dụ: nếu tài nguyên chính là tài liệu HTML, đoạn thường là thuộc tính ID của một thành phần cụ thể của tài liệu đó. Nếu đoạn này xác định một phần nhất định của bài viết được xác định bởi phần còn lại của URI, trình duyệt Web sẽ cuộn phần tử cụ thể này vào chế độ xem. Đoạn được phân tách từ phần trước bằng hàm băm (#).

Độ phân giải và tham chiếu URI

Độ phân giải URI là một trong một vài thao tác phổ biến được thực hiện trên các URI cũng là URL. Nó liên quan đến việc xác định phương thức truy cập dữ liệu phù hợp và các tham số cần thiết để định vị và truy xuất tài nguyên mà URI trỏ tới.

Tham chiếu URI được sử dụng để xác định mức sử dụng chung cho URI. Tham chiếu URI có thể có dạng URI đầy đủ, một phần cụ thể của URI đầy đủ hoặc chuỗi rỗng. Nếu có một định danh phân đoạn, nó sẽ xác định một phần tài nguyên được đề cập bởi phần còn lại của URI.

Tham chiếu URI có thể là URI, nhưng nó cũng có thể là tham chiếu tương đối. URI là một tham chiếu tương đối nếu tiền tố của tham chiếu URI không khớp với cú pháp của sơ đồ theo sau dấu phân cách dấu hai chấm của nó. Để xác định thành phần nào có mặt và liệu tham chiếu có tương đối hay không, mỗi trong số năm thành phần URI được phân tích cú pháp cho các phần con của nó và xác thực của chúng.