1. URL là gì?
URL (Uniform Resource Locator) là địa chỉ của một tài nguyên duy nhất trên Web. Mỗi URL hợp lệ sẽ trỏ đến một tài nguyên duy nhất, tài nguyên đó có thể là trang HTML, tài liệu CSS, hình ảnh, video, file PDF... Trong một số trường hợp ngoại lệ, URL có thể trỏ đến những tài nguyên không còn tồn tại hoặc đã bị di chuyển sang địa chỉ khác (moved).
URL có thể chứa nhiều thành phần khác nhau. Nó bao gồm hostname (tên máy) ánh xạ tới địa chỉ IP của một tài nguyên cụ thể trên Internet và một loạt các thông tin bổ sung thông báo cho trình duyệt và máy chủ biết cách xử lý mọi thứ. Bạn có thể nghĩ địa chỉ IP như số điện thoại, hostname như tên của người sở hữu số điện thoại đó mà bạn muốn tra cứu. Và một tiêu chuẩn được gọi là Hệ thống tên miền (Domain Name System - DNS) hoạt động trong nền giống như một cuốn danh bạ điện thoại, dịch các hostname thành địa chỉ IP để mạng sử dụng để định tuyến lưu lượng truy cập.
Đọc thêm: Top việc làm đang tuyển dụng mới nhất 2024
2. Cấu trúc của một URL hoàn chỉnh
Scheme
Rất nhiều người nghĩ rằng URL như một địa chỉ web nhưng nó không hoàn toàn đơn giản như vậy. Một địa chỉ web là URL nhưng tất cả URL không phải là địa chỉ web. Các dịch vụ khác bạn có thể truy cập trên Internet như FTP hoặc thậm chí MAILTO cũng là URL. Phần Scheme của URL (các chữ cái theo sau dấu hai chấm) biểu thị giao thức mà ứng dụng (như trình duyệt web) và máy chủ giao tiếp.
Các địa chỉ web là URL phổ biến nhất, tuy nhiên còn có các URL khác nữa. Do đó, bạn sẽ thấy các Scheme như:
- Giao thức truyền tải siêu văn bản (HTTP): Đây là giao thức cơ bản của web, xác định hành động của các máy chủ web và trình duyệt cần thực hiện để đáp ứng các lệnh nhất định.
- Giao thức HTTP an toàn (HTTPD): Đây là một dạng HTTP hoạt động trên một lớp bảo mật, được mã hóa để truyền tải thông tin an toàn hơn.
- Giao thức truyền tập tin (File Transfer Protocol - FTP): Giao thức này thường được sử dụng để truyền file qua Internet.
Lưu ý quan trọng: Trình duyệt web cũng có thể xử lý các giao thức khác, bao gồm FTP và mailto. FTP cho phép chia sẻ file giữa các máy chủ web khác nhau, cục bộ hoặc từ xa. Sau đó hướng người dùng đến một địa chỉ email cụ thể.
Authority
Phần Authority của một URL (phần bắt đầu sau hai dấu gạch chéo) được chia thành các phần nhỏ. Hãy bắt đầu với một URL đơn giản, thường là URL dẫn bạn đến trang chủ của một trang web.
Đây là một số thành phần của nó:
- Tên miền cấp cao nhất: Trong ví dụ ở đây, "com" là tên miền cấp cao nhất. Đây là mức cao nhất trong hệ thống tên miền phân cấp được sử dụng để dịch địa chỉ IP thành địa chỉ ngôn ngữ đơn giản, dễ nhớ. Những tên miền cấp cao nhất này được Tập đoàn Internet cấp số và tên miền (ICANN) tạo và quản lý. Có ba tên miền cấp cao nhất phổ biến là .com., .net, .gov. Hầu hết các quốc gia đều có trên miền cấp cao nhất gồm hai chữ cái, bạn sẽ thấy tên miền như .us (Mỹ), .vn (Việt Nam), .ca (Canada), v.v… Có một số tên miền cấp cao nhất bổ sung (như .museum) được các tổ chức cá nhân tài trợ và quản lý. Ngoài ra, cũng có một số tên miền cấp cao nhất dùng chung như.club, .life và .news.
- Tên miền phụ (Subdomain): Subdomain bao gồm bất kỳ từ hoặc cụm từ nào đứng trước dấu chấm đầu tiên của URL. Đề cập đến world wide web, www là loại phổ biến nhất. Nó chỉ ra rằng một trang web có thể truy cập được thông qua Internet và sử dụng HTTP để giao tiếp. Vì DNS là một hệ thống phân cấp, cả hai phần “www” và “example” của URL ví dụ trên được xem là tên miền phụ. Phần “www” là tên miền phụ của tên miền cấp cao nhất “com” và phần “www” là tên miền phụ của tên miền “example”. Đó là lý do tại sao bạn thấy công ty có tên đăng ký như “google.com” được chia thành các tên miền phụ như “www.google.com”, “news.google.com”, “mail.google.com”, v.v…Chủ sở hữu trang web có thể sử dụng bất kỳ từ nào làm subdomain cho các mục đích tổ chức trang web vì nó trỏ đến một thư mục cụ thể từ domain chính. Một số tùy chọn phổ biến nhất là “blog” và “news”.
Đọc thêm: Cookies là gì? Hoạt động và lợi ích của Cookies
Thành phần bổ sung của URL
Có ba phần bổ sung của URL mà bạn có thể thấy sau phần Authority: đường dẫn, truy vấn, tham số và phân mảnh.
Đường dẫn (path)
Phần Authority của URL đưa trình duyệt (hoặc các ứng dụng khác) đến đúng máy chủ trên mạng. Đường dẫn (hoạt động như đường dẫn trong Windows, macOS hoặc Linux) đưa bạn đến đúng thư mục hoặc file trên máy chủ đó. Đường dẫn được bắt đầu bằng dấu gạch chéo và có các dấu gạch chéo giữa các thư mục và thư mục con.
Phần cuối cùng là tên file sẽ được mở khi truy cập vào trang web. Mặc dù có thể bạn không thấy đường dẫn này trên thanh địa chỉ, nhưng điều đó không có nghĩa là nó không có. Một vài ngôn ngữ được sử dụng để tạo trang web ẩn tên và phần mở rộng của file để người dùng dễ nhớ và gõ URL hơn.
Truy vấn (query)
Phần truy vấn của một URL được sử dụng để xác định những thứ không phải là thành phần của một cấu trúc đường dẫn cố định. Thông thường, bạn sẽ thấy chúng được sử dụng để thực hiện tìm kiếm hoặc khi trang web phân phối dữ liệu thông qua biểu mẫu. Phần truy vấn này được bắt đầu bằng dấu hỏi chấm và theo sau đường dẫn (hoặc sau tên máy chủ nếu không có đường dẫn).
Ví dụ, dưới đây là URL khi thực hiện tìm kiếm “wi-fi extender” trên trang Amazon.
Tham số (parameter)
Là các tham số bổ sung được cung cấp cho máy chủ web. Các tham số đó là danh sách các cặp khóa/giá trị được phân tách bằng ký hiệu &. Máy chủ web có thể sử dụng các tham số đó để thực hiện các công việc bổ sung trước khi trả lại tài nguyên. Mỗi máy chủ web có các quy tắc riêng về những tham số và cách đáng tin cậy duy nhất để biết liệu một máy chủ web cụ thể có đang xử lý các tham số hay không là hỏi chủ sở hữu máy chủ web.
Liên kết neo (anchor)
Là một anchor cho một phần khác của chính tài nguyên. Anchor đại diện cho một loại "bookmark" bên trong tài nguyên, cung cấp cho trình duyệt các hướng dẫn để hiển thị nội dung nằm tại vị trí "được bookmark" đó. Ví dụ, trên một tài liệu HTML, trình duyệt sẽ cuộn đến điểm mà ký tự liên kết được xác định; trên một tài liệu video hoặc âm thanh, trình duyệt sẽ cố gắng đi đến thời điểm mà anchor thể hiện. Cần lưu ý rằng phần sau dấu #, còn được gọi là fragment identifier, không bao giờ được gửi đến máy chủ cùng với yêu cầu.
Phân mảnh (fragment)
Thành phần cuối cùng của URL mà bạn có thể thấy được gọi là phân mảnh. Phân mảnh được bắt đầu bằng một dấu thăng (#) và được sử dụng để xác định vị trí cụ thể của trang web. Khi viết code cho một trang web, các nhà thiết kế có thể tạo liên kết neo (anchor) cho văn bản cụ thể như tiêu đề. Khi sử dụng một phân mảnh thích hợp ở cuối URL, trình duyệt của bạn sẽ tải trang và sau đó chuyển đến liên kết neo đó. Liên kết neo và URL cùng với phân mảnh thường được sử dụng để tạo mục lục trang web giúp điều hướng dễ dàng hơn.
Đọc thêm: Virus (Vi rút) là gì? Tại sao máy lại dính vi rút và cách phòng tránh
3. Các loại URL phổ biến hiện nay
URL tuyệt đối và URL tương đối
Những gì chúng ta đã thấy ở trên được gọi là URL tuyệt đối, nhưng cũng có một thứ được gọi là URL tương đối. Tiêu chuẩn URL xác định cả hai - mặc dù nó sử dụng thuật ngữ chuỗi URL tuyệt đối và chuỗi URL tương đối, để phân biệt chúng với các đối tượng URL (là những đại diện trong bộ nhớ của URL).
Các phần bắt buộc của URL phụ thuộc rất nhiều vào ngữ cảnh mà URL được sử dụng. Trong thanh địa chỉ của trình duyệt, một URL không có bất kỳ ngữ cảnh nào, vì vậy bạn phải cung cấp một URL đầy đủ (hay URL tuyệt đối), giống như những URL mà chúng ta đã thấy ở trên. Bạn không cần phải bao gồm giao thức (trình duyệt sử dụng HTTP theo mặc định) hoặc cổng (chỉ bắt buộc khi web server được nhắm mục tiêu đang sử dụng một số cổng bất thường), nhưng tất cả các phần khác của URL là cần thiết.
Khi một URL được sử dụng trong tài liệu, chẳng hạn như trong trang HTML, mọi thứ sẽ khác một chút. Bởi vì trình duyệt đã có URL riêng của tài liệu, nó có thể sử dụng thông tin này để điền vào các phần còn thiếu của bất kỳ URL nào có sẵn bên trong tài liệu đó. Chúng ta có thể phân biệt giữa URL tuyệt đối và URL tương đối bằng cách nhìn vào phần đường dẫn của URL. Nếu phần đường dẫn của URL bắt đầu bằng ký tự "/", trình duyệt sẽ tìm nạp tài nguyên đó từ gốc trên cùng của máy chủ mà không cần tham chiếu đến ngữ cảnh được cung cấp bởi tài liệu hiện tại.
Canonical URL Chủ
Sở hữu trang web có thể sử dụng chúng trong trường hợp chúng có nội dung trùng lặp. Đặt một URL làm chuẩn là một cách để cho các công cụ tìm kiếm biết địa chỉ Internet nào cần thu thập thông tin và lập chỉ mục.
Callback URL
Chúng đề cập đến điểm đến chính khi người dùng hoàn tất quy trình trên hệ thống bên ngoài.
Vanity URL
Còn được gọi là URL ngắn tùy chỉnh, chúng là địa chỉ web dễ nhớ. Thông thường, một URL ảo là quá trình chuyển hướng của một URL dài hơn. Chủ sở hữu trang web có thể sử dụng công cụ rút gọn URL của trang web, như Bitly, Short.io và TinyURL.
4. Chuyển hướng URL là gì?
Đôi khi, khi bạn nhập một URL vào thanh địa chỉ của trình duyệt, trang web sẽ chuyển hướng đến một trang web khác. Điều này là do có một số cách mà URL có thể được cấu trúc và một trong số chúng không hoạt động như mong đợi. Khi điều này xảy ra, máy chủ sẽ phản hồi bằng mã trạng thái HTTP cho biết nó sẽ chuyển hướng đến một URL khác (thường là 301 hoặc 302). Sau đó, vị trí mới có thể được chỉ định trong tiêu đề phản hồi.
Các mã trạng thái và ý nghĩa của chúng bao gồm:
- 200 - OK: Yêu cầu thành công.
- 301- Moved Permanently: Tài nguyên được yêu cầu đã được di chuyển vĩnh viễn đến một vị trí mới và sẽ được truy xuất từ đó trong các yêu cầu trong tương lai.
- 302 - Found (temporary redirect): Điều này cho biết rằng trang tạm thời nằm ở một URL khác và không được lưu cache bởi các công cụ tìm kiếm hoặc được sử dụng làm nguồn thông tin trên nội dung của trang. Nó cũng có thể cho biết máy chủ đang bảo trì, trong đó các trang được chuyển hướng trong khi quá trình cập nhật đang được thực hiện hoặc khi những trang đích cần cung cấp các URL thay thế cho mục đích theo dõi, chẳng hạn như A/B testing (hay còn được gọi là split testing).
Các mã trạng thái trên dành riêng cho tính hợp lệ của chính URL và bạn có thể thậm chí sẽ không biết chúng tồn tại khi tình cờ xem một trang web đang hoạt động. Lỗi 404 trên trang web của Amazon
Tuy nhiên, khi xảy ra sự cố với URL, trang web hoặc dịch vụ web hosting cơ bản, bạn sẽ thấy một trong các mã sau:
- 403 - Forbidden: Điều này cho biết rằng bạn không được phép xem trang web. Nguyên nhân có thể là do quyền không chính xác hoặc thiếu thông tin đăng nhập xác thực.
- 404 - Not Found: Điều này cho biết rằng tài nguyên được yêu cầu không tồn tại trên máy chủ và phải được xóa khỏi bất kỳ bookmark hoặc trang kết quả của công cụ tìm kiếm (SERPs).
- 500+ - Server Errors: Lỗi này cho biết đã xảy ra lỗi trong khi xử lý yêu cầu của bạn và thường do sự cố với cấu hình máy chủ gây ra, chẳng hạn như lỗi mã hóa trong script, sự cố cơ sở dữ liệu, v.v...
Lỗi trang web có thể gây khó chịu nhưng không phải là thứ gì quá tồi tệ. Trước tiên, hãy thử refresh trang web. Tiếp theo, hãy kiểm tra thanh địa chỉ để tìm lỗi: Bạn có thể đã vô tình thêm một chữ cái, viết sai chính tả, con mèo của bạn dẫm lên bàn phím. Nếu không có cách nào có tác dụng, hãy liên hệ với chủ sở hữu trang web.
Đọc thêm: Database (Cơ sở dữ liệu) là gì? Chức năng và những loại cơ sở dữ liệu phổ biến
5. Thao tác lấy URL tối ưu
Thao tác lấy URL của trang
Bước 1: Tìm kiếm trang bạn muốn trên Google. Ví dụ: Hosting giá rẻ
Bước 2: Nhấp vào kết quả tìm kiếm có URL mà bạn cần. Thao tác này sẽ đưa bạn đến trang web.
Bước 3: Trong thanh địa chỉ của trình duyệt ở đầu trang, hãy nhấp một lần để chọn toàn bộ URL.
Bước 4: Nhấp chuột phải vào URL đó sau đó chọn Sao chép.
Bước 5: Dán URL bằng cách nhấp chuột phải vào vị trí cần dán sau đó chọn Dán.
Lấy URL của hình ảnh
Bước 1: Trên máy tính, hãy truy cập images.google.com.
Bước 2:Tìm kiếm hình ảnh đó.
Bước 3: Trên trang kết quả tìm kiếm hình ảnh, hãy nhấp vào hình ảnh đó.
Bước 4: In Trong bảng điều khiển bên phải, hãy nhấp vào biểu tượng Thêm Chia sẻ .
Bước 5: Trong phần "Nhấp để sao chép đường liên kết", hãy nhấp vào URL.
Lưu ý: URL của hình ảnh sẽ bắt đầu bằng https://images.app.goo.gl/ hoặc https://www.google.com/imgres?imgurl.
Thêm một URL đã sao chép
Sau khi bạn sao chép URL, URL đó sẽ lưu vào bảng nhớ tạm trên thiết bị của bạn.
Cách thêm hoặc sao chép qua URL:
Bước 1: Nhấp chuột phải vào trường văn bản.
Bước 2: Nhấn vào Dán.
URL đóng vai trò là địa chỉ chính xác của các nội dung được lưu trữ trên internet, giúp người dễ dàng truy cập đến các nội dung đó. Như vậy,1900 - tin tức việc làm vừa cung cấp những thông tin hữu ích về Định vị tài nguyên thống nhất. Hy vọng qua bài viết bạn hiểu được tầm quan trọng URL và sử dụng hiệu quả !
>> Khám phá thêm các chuyên mục hấp dẫn và hữu ích khác tại 1900.com.vn: