URL là gì?
URL (còn gọi là Địa chỉ định vị tài nguyên toàn cầu) là một địa chỉ web hoàn chỉnh dùng để tìm một trang web cụ thể. Miền là tên của trang web, còn một URL sẽ dẫn đến một trang nhất định nằm trong trang web đó. Mỗi URL chứa một tên miền, cũng như các thành phần khác cần thiết cho việc định vị trang hoặc phần nội dung cụ thể.
Một số URL ví dụ:
http://www.google.com
https://vi.wikipedia.org/wiki/
https://www.youtube.com/feed/trending
Cấu trúc của một URL là gì?
Cấu trúc URL được xác định vào đầu năm 1994 bởi nhà khoa học máy tính vĩ đại người Anh, Sir Tim Berners-Lee, người đã tạo ra trình duyệt web đầu tiên trên thế giới. Về cơ bản, url gần giống với đường dẫn C:\Documents\Personal\myfile.txt trong windows, nhưng được bổ sung một số thứ để có thể tìm đúng địa chỉ máy chủ trên internet và sử dụng đúng giao thức để truy cập thông tin an toàn.
Cấu trúc đơn giản của một URL mà bạn thường thấy là:
- Giao thức: http, https, ftp…
- World Wide Web: www (có thể không có thường gọi là non-www)
- Tên miền (domain) Ví dụ: seotongthe.vn
- Cổng giao tiếp (port): 443, 80, 2082, 2222…
- Ví dụ đầy đủ 1 đường dẫn URL: https://seotongthe.vn/seo-tong-the-la-gi/
Để hiểu rõ hơn các thành phần URL là gì, sau đây chúng ta sẽ cùng đi phân tích cụ thể về cấu trúc URL.
Một URL đơn giản sẽ có 2 phần chính là giao thức kết nối (Scheme) và nhà cung cấp (Authority).
Scheme trong URL là gì?
Nhiều người nghĩ rằng URL là một địa chỉ web. Tuy nhiên, nó không đơn giản như vậy. Một địa chỉ web là URL. Nhưng URL không chỉ là địa chỉ website thôi đâu. Ngoài địa chỉ web, các dịch vụ khác bạn cũng có thể truy cập trên internet như FPT hay cả MAILTO đều là URL.
Trong đó, phần Scheme của URL (phần chữ trước dấu 2 chấm) biểu thị giao thức mà ứng dụng và máy chủ giao tiếp.
Có 3 dạng giao thức Scheme chủ yếu sau:
- Giao thức truyền tải siêu văn bản (HTTP): Là dạng giao thức cơ bản của web, xác định hành động của các máy chủ web và trình duyệt cần thực hiện, để đáp ứng các lệnh nhất định nào đó.
- Giao thức an toàn (HTTPS): Là một dạng HTTP được hoạt động với lớp bảo mật, mã hóa, đảm bảo thông tin được truyền tải một cách an toàn hơn.
- Giao thức truyền tệp tin (FTP – File Transfer Protocol): Giao thức được sử dụng để truyền tải file qua internet.
Với các trình duyệt hiện đại như ngày này, bạn có thể không cần sử dụng Scheme để truy cập địa chỉ nào đó, bởi trình duyệt có thể tự động xác định giao thức phù hợp. Tuy nhiên, trong một số trường hợp yêu cầu bắt buộc, bạn vẫn phải nhập đầy đủ cả giao thức.
Authority
Phần Authority của một URL (phần bắt đầu sau hai dấu gạch chéo) được chia thành các phần nhỏ. Hãy bắt đầu với một URL đơn giản, thường là URL dẫn bạn đến trang chủ của một trang web.
Trong ví dụ đơn giản này, toàn bộ phần “www.example.com” được gọi là hostname và có nhiệm vụ lấy một địa chỉ IP. Nếu biết địa chỉ IP, bạn có thể gõ nó vào thanh địa chỉ trình duyệt thay vì hostname.
Đây là một số thành phần của nó:
- Tên miền cấp cao nhất: Trong ví dụ ở đây, “com” là tên miền cấp cao nhất. Đây là mức cao nhất trong hệ thống tên miền phân cấp được sử dụng để dịch địa chỉ IP thành địa chỉ ngôn ngữ đơn giản, dễ nhớ. Những tên miền cấp cao nhất này được Tập đoàn Internet cấp số và tên miền (ICANN) tạo và quản lý. Có ba tên miền cấp cao nhất phổ biến là .com., .net, .gov. Hầu hết các quốc gia đều có trên miền cấp cao nhất gồm hai chữ cái, bạn sẽ thấy tên miền như .us (Mỹ), .vn (Việt Nam), .ca (Canada), v.v… Có một số tên miền cấp cao nhất bổ sung (như .museum) được các tổ chức cá nhân tài trợ và quản lý. Ngoài ra, cũng có một số tên miền cấp cao nhất dùng chung như.club, .life và .news.
- Tên miền phụ (Subdomain): Vì DNS là một hệ thống phân cấp, cả hai phần “www” và “example” của URL ví dụ trên được xem là tên miền phụ. Phần “www” là tên miền phụ của tên miền cấp cao nhất “com” và phần “www” là tên miền phụ của tên miền “example”. Đó là lý do tại sao bạn thấy công ty có tên đăng ký như “google.com” được chia thành các tên miền phụ như “www.google.com”, “news.google.com”, “mail.google.com”, v.v…
Đây là ví dụ cơ bản nhất về phần Authority của URL, các URL khác có thể phức tạp hơn. Có hai thành phần khác trong phần Authority:
- Thông tin người dùng: Phần Authority cũng có thể chứa tên người dùng và mật khẩu của trang web bạn đang truy cập. Ngày nay, bạn có thể ít bắt gặp cấu trúc URL này. Phần thông tin người dùng ở trước tên máy chủ và nó theo sau bởi dấu @. Ví dụ, bạn có thể thấy một URL bao gồm thông tin người dùng như sau:
//username:password@www.example.com
- Số cổng: Thiết bị mạng sử dụng địa chỉ IP để nhận thông tin đến máy tính phù hợp trên mạng. Khi lưu lượng truy cập đến, số cổng thông báo với máy tính biết ứng dụng mà lưu lượng truy cập đó đang nhắm đến. Bạn thường không thấy số cổng khi lướt web, nhưng có thể thấy nó trong các ứng dụng mạng như trò chơi yêu cầu nhập URL. Nếu URL chứa số cổng, nó xuất hiện ở sau tên máy chủ và trước dấu hai chấm. Bạn sẽ thấy nó trông giống như này:
//www.example.com:8080
Thành phần bổ sung của URL
Có ba phần bổ sung của URL mà bạn có thể thấy sau phần Authority: đường dẫn, truy vấn và phân mảnh.
– Đường dẫn (path)
Phần Authority của URL đưa trình duyệt (hoặc các ứng dụng khác) đến đúng máy chủ trên mạng. Đường dẫn (hoạt động như đường dẫn trong Windows, macOS hoặc Linux) đưa bạn đến đúng thư mục hoặc file trên máy chủ đó. Đường dẫn được bắt đầu bằng dấu gạch chéo và có các dấu gạch chéo giữa các thư mục và thư mục con như sau:
www.example.com/folder/subfolder/filename.html
Phần cuối cùng là tên file sẽ được mở khi truy cập vào trang web. Mặc dù có thể bạn không thấy đường dẫn này trên thanh địa chỉ, nhưng điều đó không có nghĩa là nó không có. Một vài ngôn ngữ được sử dụng để tạo trang web ẩn tên và phần mở rộng của file để người dùng dễ nhớ và gõ URL hơn.
– Truy vấn (query)
Phần truy vấn của một URL được sử dụng để xác định những thứ không phải là thành phần của một cấu trúc đường dẫn cố định. Thông thường, bạn sẽ thấy chúng được sử dụng để thực hiện tìm kiếm hoặc khi trang web phân phối dữ liệu thông qua biểu mẫu. Phần truy vấn này được bắt đầu bằng dấu hỏi chấm và theo sau đường dẫn (hoặc sau tên máy chủ nếu không có đường dẫn).
Ví dụ, dưới đây là URL khi thực hiện tìm kiếm “wi-fi extender” trên trang Amazon.
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extende
Biểu mẫu tìm kiếm đã chuyển thông tin tới công cụ tìm kiếm của Amazon. Theo sau dấu chấm hỏi là hai phần của truy vấn: URL cho tìm kiếm (đó là phần “url=search-alias%3Daps&field”) và từ khóa đã nhập (đó là phần “keywords=wi-fi+extender”).
Đây là một ví dụ khá đơn giản và bạn sẽ thường thấy các URL với các phần bổ sung khác nhau. Ví dụ đây là URL khi tìm kiếm từ khóa “quantrimang” trên Google.
https://www.google.com.vn/search?q=quantrimang&oq=quantrimang&aqs=chrome..69i57j69i60j69i65j69i60l2.2397j0j1&sourceid=chrome&ie=UTF-8
Như bạn có thể thấy, có một số thông tin khác ở đây. Trong trường hợp này bạn sẽ thấy cả trình duyệt sử dụng.
– Phân mảnh (fragment)
Thành phần cuối cùng của URL mà bạn có thể thấy được gọi là phân mảnh. Phân mảnh được bắt đầu bằng một dấu thăng (#) và được sử dụng để xác định vị trí cụ thể của trang web. Khi viết code cho một trang web, các nhà thiết kế có thể tạo liên kết neo (anchor) cho văn bản cụ thể như tiêu đề. Khi sử dụng một phân mảnh thích hợp ở cuối URL, trình duyệt của bạn sẽ tải trang và sau đó chuyển đến liên kết neo đó. Liên kết neo và URL cùng với phân mảnh thường được sử dụng để tạo mục lục trang web giúp điều hướng dễ dàng hơn.
Phân loại URL là gì?
Hầu hết mọi website đều sẽ có cả 2 loại URL:
- URL động (?id=..) : là URL có thể thay đổi. URL động thường là các diễn đàn hoặc website thiết kế mã nguồn mở. Nó không thân thiện với công cụ tìm kiếm, và nó gần như giống nhau.
- URL tĩnh (.html) : là URL không thể thay đổi. URL tĩnh được xếp hạng tốt hơn trong công cụ tìm kiếm. URL tĩnh được index nhanh hơn URL động. Nó giúp người dùng dễ dàng hiểu đươc website có ý nghĩa gì. Khi mọi người nhìn thấy một URL cụ thể phù hợp với tiêu đề và mô tả, khả năng họ nhấp chuột vào tìm hiểu sẽ cao hơn một địa chỉ URL không có ý nghĩa gì với họ.
URL quan trọng như thế nào với SEO?
URL là một yếu tố vô cùng quan trọng trong SEO, nó có thể gây ảnh hưởng tới cả chiến lược SEO Marketing của doanh nghiệp. bời vì:
- Cũng như thẻ title, việc tối ưu hóa URL ảnh hưởng trực tiếp thứ hạng của trang web trên SERPs.
- Thu hút khách hàng click vào link nếu URL liên quan đến đúng keyword tìm kiếm.
- Một URL được tối ưu sẽ giúp người dùng dễ nhớ, họ có thể gõ lại URL để vào web của bạn nếu muốn truy cập vào lần sau.
- Trong một vài trường hợp đi xây dựng backlink thì anchor text URL giúp bạn xây dựng sự đa dạng từ khóa rất tốt.
Cách tối ưu thẻ URL chuẩn SEO
URL đã được tối ưu giúp cho các công cụ tìm kiếm dễ dàng đọc và lập chỉ mục. Đưới đây là các cách viết một cấu trúc URL:
- Tối ưu nội dung URL?
- Tối ưu cấu trúc URL
– Tối ưu nội dung gì của URL?
- Từ khóa: Đường dẫn URL nên chứa từ khóa và từ khóa đó nên đặt ngay đầu URL.
- Về nội dung: Đảm bảo ngắn gọn và mang tính mô tả. Để người dùng nhìn vào đó có thể hiểu được nội dung của trang web là gì.
- Giới hạn ký tự trong URL: URL của bạn chỉ nên gồm 10 từ hoặc 96 ký tự.
- Stop words: Hạn chế sử dụng những chữ dạng stop words trong url. Những từ dạng stop words sẽ làm cho công cụ tìm kiếm tránh quét chúng.
– Tối ưu cấu trúc URL như thế nào?
- Không chứa ký tự lạ: Nên Sử dụng URL ở dạng tĩnh, Sử dụng dấu nối (-) để ngăn cách các từ. Không nên sử dụng dấu gạch dưới (_) hay bất kì kí tự lạ ( ví dụ như “^”, “#”, “%”, “=”, “@”,”?”, “$” ) vì Google sẽ không nhận diện được liên kết của bạn.
- Giữ nguyên cấu trúc đường dẫn URL: Không nên thay đổi cấu trúc đường dẫn URL khi Google đã index liên kết đó. Trong trường hợp buộc phải đổi thì nên sử dụng redirect 301 chuyển URL cũ sang mới. Điều này giúp website của bạn không bị ảnh hưởng nhiều.
- Đường dẫn URL nên hạn chế dần về thư mục con: URL của bạn không nên đi qua quá nhiều trang chính mới đến trang cần SEO. Điều này sẽ không được Google đánh giá cao. Một đường link tối ưu nên dẫn về đúng bài viết và không nên phân chia thành nhiều thư mục nhỏ.
- URL Friendly = URL tĩnh và chứa từ khóa: URL chứa từ khóa sẽ làm tăng giá trị của bài viết. Ngoài ra, Google thích trang web tĩnh (.html) hơn là trang web động (?id=..).
– Check list URL chuẩn SEO tổng thể
Khi tối ưu SEO bạn cần đặc biệt chú ý đến URL và cách tối ưu URL để trang web được xếp hạng tốt trên kết quả tìm kiếm, dưới đây là những checklist về URL cần tối ưu chuẩn SEO tổng thể
- Giới hạn ký tự trong URL
- URL phải có chứa từ khóa chính hoặc ít nhất là từ khóa phụ
- Không chỉnh sửa URL khi đã được Google Index
- Chuyển từ URL động thành URL tĩnh
- Dùng dấu gạch nối để phân cách từ khóa với nhau
- Không để trùng lặp URL
- Giữ URL đơn giản, dễ hiểu
- Nên viết thường
- URL không nên chứa các con số
- Bắt đầu với từ khóa chính
- URL không nên chứa các ký tự đặc biệt
- URL không quá 2 cấp
Sau đây tôi xin chia sẻ chi tiết từng checklist để bạn nắm được rõ hơn cách tối ưu:
Giới hạn ký tự trong URL
URL của một bài viết hoặc một trang chỉ nên ngắn gọn trong khoảng 96 ký tự hoặc 10 từ. Đa phần các Website đều được cài đặt công cụ kiểm tra SEO nên bạn dễ điều chỉnh phù hợp. Còn với những Website không có công cụ kiểm tra thì bạn hãy nhớ kiểm tra lại trước khi đăng. Đây là cách tối ưu URL chuẩn SEO đầu tiên mà bạn phải tuân thủ theo.
URL phải có chứa từ khóa chính hoặc ít nhất là từ khóa phụ
Nếu muốn URL chuẩn SEO, bạn cần thêm các từ khóa cần SEO vào chính URL đó. Lưu ý, bạn chỉ nên đặt từ khóa chính một lần tránh lặp lại vì sẽ khiến URL bị dài. Điều này sẽ khiến bài viết hoặc trang đó vi phạm về quy tắc độ dài của URL.
Không chỉnh sửa URL khi đã được Google Index
Lưu ý không nên chỉnh sửa quá nhiều lần đối với trang đã được Index trên công cụ tìm kiếm. Vì nó sẽ khiến cho URL này gần như thay đổi hoàn toàn thành một URL mới. Điều này sẽ khiến các công cụ tìm kiếm mất một khoản thời gian để Index lại từ đầu URL của bạn.
Chuyển từ URL động thành URL tĩnh
Để tối ưu URL chuẩn SEO, bạn hãy chuyển URL động sang URL tĩnh để dễ chỉnh sửa
Cách tối ưu URL chuẩn SEO là bạn không nên để các ký tự đặc biệt hay từ có dấu trong Link. Nó sẽ khiến thuật toán trong công cụ tìm kiếm không hiểu được và đánh giá thấp URL của bạn. Để tránh lỗi này thì bạn hãy chuyển URL động thành URL tĩnh, sau đó chỉnh sửa nó.
Dùng dấu gạch nối để phân cách từ khóa với nhau
Để dấu “-” phân cách các từ trong URL sẽ giúp công cụ tìm kiếm dễ hiểu cấu trúc URL hơn. Ngoài ra, nó còn giúp người dùng nhận diện dễ dàng hơn khi họ tìm kiếm từ khóa liên quan.
Không để trùng lặp URL
Nếu như bạn để nhiều URL trùng lặp thì mặc định Search Engine sẽ tính lỗi Duplicate cho Website bạn. Thông thường lỗi này sẽ mắc ở khâu Content SEO vì vậy bạn không được để URL bị trùng lặp.
Giữ URL đơn giản, dễ hiểu
Các URL có cấu trúc đơn giản và ngắn gọn với nội dung dễ hiểu sẽ giúp tăng lượng Click. Từ đó mà lượng người xem cũng tăng lên so với các URL dài dòng có nội dung lan man.
Nên viết thường
Một cách tối ưu URL chuẩn SEO khá quan trọng nữa, giúp mang lại hiệu quả SEO cao hơn là để URL ở dạng chữ thường.
URL không nên chứa các con số
Trong tương lai có thể bạn sẽ thêm một số quá trình hoặc các bước vào bài viết của mình. Vì vậy, nếu để số vào URL sẽ khiến bạn khó thay đổi URL sau này khi đổi nội dung.
Bắt đầu với từ khóa chính
Bạn hãy cố gắng đặt từ khóa chính ở ngay đầu URL để giúp ích cho việc tối ưu URL chuẩn SEO. Vì khi người dùng thấy URL dạng này của bạn trên công cụ tìm kiếm, họ sẽ biết chắc rằng đây là nội dung mà họ cần.
URL không nên chứa các ký tự đặc biệt
Các ký tự như: Dấu gạch chéo ngược “/”, dấu ngoặc vuông “[]”, dấu ngoặc tròn “()”,… là những ký tự không an toàn đối với URL. Do đó, bạn không nên đặt ở trong URL của mình, ngoài ra còn các dấu như: Hai chấm, dấu chấm phẩy, dấu phẩy,… cũng nên được loại bỏ.
URL không quá 2 cấp
Điều này sẽ phụ thuộc vào cấp độ danh mục mà bạn thiết kế trong trang Web của mình. Tuy nhiên, bạn chỉ nên đặt tối đa 2 cấp con là phù hợp nhất với người dùng và Search Engine.
Những câu hỏi thường gặp về URL
Độ dài tối ưu của URL là bao nhiêu?
- Độ dài trung bình của URL cho Gmail: 59 ký tự.
- Độ dài trung bình của URL cho Webmaster Tools: 90 ký tự.
- Độ dài trung bình của URL cho blog Google: 76 ký tự.
- Độ dài tối đa của URL để được hiển thị trên trình duyệt Chrome, Cốc cốc, Firefox, IE,…: 2048 ký tự.
Điều kiện thiết lập một URL là gì?
- URL phải ít hơn 2048 ký tự để được hiển thị trên trình duyệt Chrom, Cốc cốc, Firefox, IE,…v.v
- Sử dụng ” / ” để ngăn cách thư mục, dấu ” – ” giữa các từ.
- Không nên dùng dấu “_” hay dấu cách
- Không nên dùng tiếng Việt có dấu như: â, ê, ư…
Cách nhận biết 1 link URL có an toàn hay không
Thao tác kiểm tra thuộc tính target của link:
- Lấy URL của website mà bạn muốn kiểm tra: Nhấp chuột phải vào link để copy thuộc tính target của 1 link.
2.Sao chép thuộc tính target của link trên bộ nhớ máy tính:
- Copy link address (nếu dùng trình duyệt Google Chrome),
- Copy link location (Firefox)
- Copy shortcut (Internet Explorer).
- Dán vào các tool kiểm tra link dưới đây để kiểm tra: Norton Safe Web, SiteAdvisor (by McAfee), Browser Defender, URL Void
URL và Link khác nhau như thế nào?
Một số người thường sử dụng thuật ngữ URL và Link để thay thế cho nhau mà không biết hai khái niệm này có sự khác biệt nhất định:
- Link được sử dụng để đưa người dùng từ địa chỉ này sang địa chỉ khác, trong khi URL là địa chỉ để liên kết đến website.
- Link không tuân theo bất kỳ giao thức nào, còn URL sẽ phải tuân theo các giao thức, như http, https, ftp.
- Link không có cú pháp cụ thể, trong khi URL thì có.
Bạn đã hiểu URL là gì và cách tối ưu URL chuẩn SEO như thế nào rồi chứ? Tuy nhiên bạn cũng lưu ý rằng, tối ưu URL cũng chỉ là một trong hàng trăm tiêu chí xếp hạng của Google để website lên được top kết quả tìm kiếm, muốn website của bạn có được thứ hạng cao bạn cần tối ưu thêm các yếu tố Onpage khác, mời bạn tham khảo bài checklist tối ưu Onpage tại đây