Sitemap là gì? Cách tạo và tối ưu sitemap chuẩn SEO

Sitemap là gì? Đó là một phần quan trọng trong việc tối ưu hóa SEO Technical cho bất kỳ trang web nào. Đây là một vũ khí hiệu quả giúp các bạn SEO hiệu quả hơn. Vậy chính xác Sitemap là gì? Tạo Sitemap cho website như thế nào?

Sitemap là gì?

Sitemap còn được gọi là sơ đồ trang web. Sitemap là tập tin văn bản chứa tất cả đường dẫn URL của một website. Bên cạnh đó, sitemap còn có thể chứa các siêu dữ liệu về mỗi đường dẫn thông báo sẽ được gửi đến cho bạn khi URL đó mới được cập nhật.

Sitemap có tác dụng hướng dẫn cho con bot của Google hay công cụ tìm kiếm thu thập thông tin website một cách hiệu quả, cập nhật những thay đổi trên trang website của bạn.

Tips: Bạn có thể xem giao thức cho Sitemap tại đây – https://www.sitemaps.org/index.html

Vai trò của sitemap đối với website

Sitemap nên được cập nhập thường xuyên khi trang web thường xuyên có bài viết mới. Điều đó sẽ giúp cho bộ máy tìm kiếm nhanh chóng thu thập. Sau đó sẽ hiển thị trên trang kết quả tìm kiếm và thu hút người dùng đến với website của bạn.

– Vai trò đối với người dùng

Những website lớn, cơ sở dữ liệu, thông tin đồ sộ khiến cho người dùng phải cân nhắc lựa chọn các danh mục, nội dung cần tìm kiếm. Để dễ dàng xác định được nội dung cần tìm kiếm và lựa chọn nội dung trên website thì vai trò của sitemap là không thể thiếu.

Thông qua sitemap, giúp người dùng nhanh chóng tìm kiếm được nội dung theo yêu cầu. Chỉ cần xem trong thư mục sitemap là họ đã có thể dễ dàng tìm được nội dung mình cần.

Nếu như người dùng muốn tìm kiếm chính xác nội dung thông tin trên trang web. Bạn chỉ cần chọn chức năng tìm kiếm sơ đồ trên website. Sau đó từ khóa được nhập tìm kiếm đến với nơi người dùng cần tìm trên website.

Với vai trò của sitemap thì người dùng sẽ ở lại với trang web nhiều hơn. Đồng thời giúp tăng thời gian truy cập, cùng với những thông tin trên website hữu ích. Sẽ giúp đẩy website của bạn thân thiện với người dùng hơn. Chắc chắn đây là một trong những yếu tố giúp thúc đẩy quá trình lên top nhanh hơn.

– Sitemap trong quá trình SEO

Sitemap luôn là một trong những yếu tố rất quan trọng để giúp những con bot trên công cụ tìm kiếm có thể index tất cả nội dung trên website của bạn. Mà không lo bị bỏ sót bất cứ một bài viết nào trên trang website của bạn.

Hơn nữa, sitemap còn giúp cho những chỉ mục sau khi được index sẽ được sắp xếp một cách khoa học để mang đến hiệu quả tốt hơn. Điều hướng những con bot tìm kiếm cũng như thu thập thông tin được chuyên sâu đến từng ngóc ngách trên trang.

Bạn nên chú tâm rằng, vai trò của sitemap chỉ đi vào những đường dẫn mà bạn đã tiến hành khai báo trước đó. Còn đối với những đường dẫn không được khai báo thì nó bỏ qua.

Sitemap là một trong những công cụ có vai trò quan trọng trong công việc và hoạt động của SEO. Sitemap giúp cho công cụ tìm kiếm trở nên nhanh hơn trong quá trình thu thập những thông tin, dữ liệu quan trọng của website.

Bên cạnh đó, vai trò của sitemap còn phân tích toàn bộ trang web. Nếu như phát hiện bất cứ vấn đề gì thì sẽ có thông báo cho quản trị web. Để từ đó có giải pháp cũng như khắc phục kịp thời giúp website của bạn trở nên tốt hơn.

Một số loại Sitemap bạn cần biết

Loại Sitemap website này được phân thành các dạng sau:

  • XML Sitemap: Đây là dạng sơ đồ phục vụ cho các bot tìm kiếm có thể thu thập thông tin và lập chỉ mục website dễ dàng hơn.
  • HTML Sitemap: Dạng bản đồ này được sử dụng phổ biến trong mọi website hiện nay nhằm giúp người dùng truy cập có thể tìm thấy tài nguyên trên website nhanh hơn. Vì HTML Sitemap giúp nâng cao trải nghiệm người dùng hiệu quả – website được Google đánh giá tốt sẽ xếp hạng cao hơn.

Sẽ có nhiều tranh cãi từ việc nên sử dụng XML hay HTML Sitemap sẽ tốt hơn? Thực tế bạn cần sử dụng cả 2 dạng sơ đồ này để đáp ứng nhu cầu của người dùng và cả công cụ tìm kiếm.

phan loai sitemap - SEO tổng thể website

Hướng dẫn cách tạo sitemap cho trang web

Sitemap là một trong những phần quan trọng của website. Do đó bạn cần biết cách tạo sitemap cho trang website của mình. Khi khởi tạo phải chính xác bởi nếu bạn cấu hình sitemap không đúng sẽ khiến vị trí của website sẽ bị xuống hạng một cách nhanh chóng. Hãy cùng tìm hiểu ngay cách khởi tạo sitemap để hoàn thiện trang web.

– Nếu website sử dụng Worpress

Nếu website của bạn làm bằng wordpress thì việc tạo Sitemap thật dễ dàng, bạn có thể cài Yoast SEO có thể kích hoạt Sitemap XML trực tiếp trong plugin, hoặc sử dụng Plugin Rank Math để tạo sitemap.xml tự động.

Trong hình dưới đây mình hướng dẫn cách bạn tạo sitemap.xml bằng Plugin Rank Math.

Bước 1: Bạn cần cài Plugin Rank Math, bằng cách vào Plugin/ Cài mới và tìm từ khóa Rank Math/ Click chọn Cài đặt/ Click chọn kích hoạt

Bước 2: Bạn cần cấu hình Rank Math

Bước 3: Sau khi cài đặt Rank Math xong bạn click vào Rank Math/ Chọn Sitemap Settings sau đó cấu hình số link trong sitemap, ví dụ ở hình dưới đây tôi cấu hình 200 link cho sitemap.xml

rank math sitemap - SEO tổng thể website

 

– Nếu website không dùng WordPress

Tạo sitemap với https://xmlsitemapgenerator.org/

Nếu bạn không dùng WordPress bạn có thể sử dụng Công cụ sinh sitemap tự động miễn phí XML Sitemap Generator công cụ này sẽ tạo 500 URL cho trang web của bạn.
Hướng dẫn tạo sitemap tự động với công cụ XML Sitemap Generator

tao sitemap - SEO tổng thể website

Bước 1: Truy cập vào link: https://xmlsitemapgenerator.org/sitemap-generator.aspx
Bước 2: Nhập địa chỉ site của bạn và thêm các tùy chọn như tần suất post Content sau đó click nút “Generate sitemap”
Bước 3: Updload file sitemap.xml lên Google Search Console như trình bày trong mục 2 của bài viết

Ngoài ra, bạn có thể tự tạo một Sitemap bằng cách tuân theo cấu trúc mã Sitemap XML. Về mặt kỹ thuật, Sitemap của bạn thậm chí không cần phải ở định dạng XML – một tệp văn bản với một dòng mới phân tách từng URL sẽ đủ.

Tuy nhiên, bạn sẽ cần tạo một Sitemap XML hoàn chỉnh nếu bạn muốn triển khai thuộc tính hreflang, vì vậy việc để một công cụ thực hiện công việc cho bạn sẽ dễ dàng hơn nhiều.

Tạo Sitemap với https://xml-sitemaps.com

Hiện nay có nhiều công cụ hỗ trợ bạn trong viết tạo sitemap. Tuy nhiên trong bài viết này chúng tôi muốn giới thiệu đến các bạn cách tạo sitemap trực tiếp ngay trên internet rất hiệu quả và được rất nhiều SEOer sử dụng.

Đầu tiên bạn cần phải có một trang web vẫn còn đang hoạt động. Sau đó tạo một file văn bản, có thể dùng Notepad ++ để cài đặt thông số Priority cho các URL theo mong muốn.

Bước 1: Truy cập vào trang web www.xml-sitemaps.com để tiến hành

Bước 2 : Điền những thông số sau theo yêu cầu:

– Starting URL: Gõ địa chỉ website của bạn vào mục này.

– Change frequency: Tại đây thì bạn nên chọn daily. Ngoài ra bạn có thể chọn thông số khác phù hợp với nhu cầu.

– Last modification: Tại đây nên chọn Use server’s response

– Priority: Để tự động (Automatically calculated priority)

Sau khi setup xong thì bấm vào Start để cho nó chạy. Quá trình sẽ rất nhanh nếu như website của bạn đơn giản và nội dung chưa nhiều. Sau khi quá trình này xong thì bạn sẽ nhận được một danh sách các file sitemap. Tuy nhiên, cách tạo sitemap thì bạn chỉ cần chú ý đến 4 file quan trọng là sitemap.xml, ror.xml, sitemap.html và urllist.txt

Bước 3 : Tải xuống file xml

Sau khi tải về máy tính thì bạn mở file sitemap.xml lên bằng ứng dụng Notepad ++. Sau đó thì cài đặt thông số Priority cho các url theo ý bạn.

Lưu ý những thông số Priority quy định mức độ quan trọng của các url đối với website của bạn. Nếu như Url nào quan trọng thì nên để nó cao điểm hơn. Thang điểm cao nhất là 1.0 và thấp nhất là 0.10.

Bước 4: Tải file sitemap.xml lên website.

Bước 5: Sử dụng công cụ Google Webmaster Tools để cập nhật sitemap lên cơ sở dữ liệu của Google. Vậy là đã hoàn thành cách tạo sitemap cho trang web.

Một số chú ý khi tạo sitemap

Khi tạo Sitemap, bạn nên lưu ý các vấn đề bên dưới:

  • Một tập tin Sitemap không được > 50Mb khi giải nén và không chứa > 50.000 URLs. Nếu Sitemap website của bạn quá lớn, thì nên phân thành các file Sitemap nhỏ hơn để đảm bảo server web không hoạt động quá tải khi phải phục vụ các tập tin lớn cho Google.
  • Nếu bạn có nhiều hơn một Sitemap thì hãy liệt kê trong một tập tin chỉ mục Sitemap.
  • Nếu URL website của bạn mặc định là http://www.example.com/ => bắt buộc URL trong Sitemap phải có định dạng như vậy.
  • URL trong sitemap không chứa ID.
  • Sơ đồ trang web phải xác định không gian tên XML: xmlns = “http://www.sitemaps.org/schemas/sitemap/0.9” .
  • URL Sitemap phải được mã hóa UTF8 và phải đảm bảo dễ đọc / dễ hiểu đối với các server web.
  • Nếu website của bạn truy cập được trên cả 2 phiên bản “www” và “không có www” thì cần tạo Sitemap riêng biệt cho mỗi phiên bản.
  • Từng Sitemap phải độc lập với từng ngôn ngữ của nội dung. Đặc biệt mỗi phiên bản ngôn ngữ phải sử dụng một URL (có thể bao gồm trong các Sitemap) duy nhất để Googlebot có thể crawl và index.

Cách đăng ký Sitemap với Google

Bạn có thể gửi Sitemap của mình cho Google từ Google Search Console. Từ bảng điều khiển của bạn, nhấp Tên trang web > Sơ đồ trang web > Gõ sitemap.xml sau đó click Gửi để thêm sitemap vào Google Search Console.

sitemap google search console - SEO tổng thể website

Kiểm tra Sitemap của bạn và xem kết quả trước khi bạn nhấp vào Gửi Sitemap để kiểm tra các lỗi có thể ngăn các trang đích chính bị lập chỉ mục.

Lý tưởng nhất là bạn muốn số lượng trang được lập chỉ mục giống với số lượng trang được gửi.

Lưu ý rằng việc gửi Sitemap của bạn cho Google biết những trang nào bạn cho là chất lượng cao và xứng đáng được lập chỉ mục, nhưng điều đó không đảm bảo rằng chúng sẽ được lập chỉ mục.

Thay vào đó, lợi ích của việc gửi Sitemap của bạn là:

  • Giúp Google hiểu cách website của bạn được cấu trúc.
  • Khám phá các lỗi bạn có thể sửa để đảm bảo các trang của bạn được lập chỉ mục đúng.

12 Cách tối ưu Sitemap website hiệu quả cho SEO

Chúng ta đã đến phần cực kỳ quan trọng, đó là tối ưu hóa Sitemap website để hỗ trợ làm SEO tốt hơn. Và bây giờ, bạn hãy tham khảo 12 cách đơn giản nhưng hiệu quả mà Prodima chia sẻ dưới đây nhé!

– Tạo XML Sitemap động cho những trang web lớn

Bạn không thể kiểm soát tất cả URL của những website lớn trong Sitemap. Thay vào đó, bạn hãy tạo ra những quy tắc chung để quyết định trang nào sẽ được đưa vào XML Sitemap và thay đổi từ “noindex” => “index, follow”. Hoặc bạn có thể sử dụng các công cụ hỗ trợ tạo XML Sitemap động một cách nhanh chóng.

Ưu tiên các trang quan trọng

Bạn nên ghi nhớ: Không điều hướng Googlebot đến các trang chất lượng thấp và không quan trọng! Vì các bot sẽ ngầm hiểu những trang web này không phải là địa chỉ lý tưởng cho người dùng truy cập.

Chất lượng của các trang web như thế nào cũng sẽ ảnh hưởng rất lớn đến xếp hạng website trên các kết quả tìm kiếm.

Thay vào đó, bạn nên hướng các bot đến những trang chất lượng cao nhất – là những trang đã được tối ưu hóa chuẩn SEO từ nội dung giá trị, hình ảnh cho đến video. Và sẽ càng tốt hơn, nếu các trang này có thêm nhận xét hay đánh giá từ khách hàng.

Khai báo Sitemap đến Google

Bạn sử dụng công cụ Google Search Console để khai báo Sitemap đến Google bằng cách: Từ bảng điều khiển của bạn, nhấp Tên trang web > Sơ đồ trang web > Gõ sitemap.xml sau đó click Gửi để thêm sitemap vào Google Search Console.

sitemap google search console - SEO tổng thể websiteKhai báo Sitemap trên Google Search Console

Hãy kiểm tra Sitemap và xem kết quả trước khi quyết định nhấn Submit Sitemap, để tránh các lỗi không mong muốn sẽ ảnh hưởng đến việc Googlebot index những trang đích.

=> Hầu hết chúng ta đều muốn Google lập chỉ mục những trang được gửi, nhưng không phải tất cả đều được thông qua.

Tuy nhiên, lợi ích khi tạo Sitemap website là:

  • Giúp Google dễ dàng hiểu chủ đề và cấu trúc trang web của bạn.
  • Phát hiện các lỗi cần được sửa để các trang của bạn được index đúng cách.

Sử dụng RSS/Atom Feeds

RSS/Atom Feeds là một dạng XML – tạo ra kênh tóm tắt thông tin website.

Mỗi khi trang của bạn cập nhật hoặc thêm nội dung mới, RSS sẽ phát tín hiệu đến Googlebot để cập nhật và lưu giữ các thông tin mới nhất.

Google luôn khuyến khích việc sử dụng kết hợp Sitemap và RSS / Atom Feeds để các bot có thể biết chính xác trang nào cần được cập nhật và index.

Thông qua RSS / Atom Feeds, website của bạn thân thiện hơn với người dùng truy cập và cả công cụ tìm kiếm. Điều này rất có lợi khi làm SEO và giúp trang “leo” top tốt hơn.

Cô lập các chỉ mục bị lỗi

Google Search Console không thể giúp bạn lập chỉ mục cho tất cả trang web, cũng như gửi thông báo cụ thể cho bạn khi trang có lỗi.

Tình trạng này thường gặp ở những website thương mại điện tử, vì có nhiều trang với sản phẩm tương đồng. Trong trường hợp này, bạn nên cô lập các trang có vấn đề, để giúp tối ưu file Sitemap tốt hơn.

Khuyến cáo từ nhà tư vấn SEO Michael Cottam: Nên tạo sơ đồ trang XML khác nhau cho mỗi trang sản phẩm. Sau đó, tiến hành thử nghiệm trên từng trang.

google search console - SEO tổng thể website
Nên cô lập các trang bị lỗi để chỉnh sửa

=> Dựa vào kết quả, bạn sẽ xác định được nguyên nhân khiến trang đó không được index, có thể là do trùng lặp nội dung, không có hình ảnh sản phẩm… để có thể tìm giải pháp khắc phục. Và đừng quên, gắn tag các trang này thành “NoIndex” để không giảm chất lượng trang nhé!

Không thêm URL ‘noindex’ vào Sitemap

Nếu bạn không muốn Googlebot crawl và index một URL bất kỳ, hãy bỏ ra khỏi Sitemap.

Việc đặt tất cả trang không quan trọng “nằm” cùng các trang giá trị cao sẽ thể hiện sự thiếu nhất quán. Chỉ nên đặt những URL nào bạn muốn index vào Sitemap!

Sử dụng thẻ Meta Robot trên Robots.txt

Thông thường, chúng ta sẽ dùng thẻ Meta Robot “Noindex, Follow” để ngăn Googlebot không index những trang web không mong muốn. Nếu bạn đã cạn kiệt ngân sách crawl thông tin, hãy sử dụng Robots.txt để chặn các trang.

Giữ phiên bản Canonical URLs trong Sitemap

Nếu website có nhiều trang tương đồng, nên gắn tag ‘link rel=canonical’ để Googlebot xác định rõ trang nào là trang “chính” bạn muốn index.

Cài đặt bản Canonical trong Sitemap sẽ giúp các bot tìm kiếm trang chính nhanh hơn để có thể crawl và lập chỉ mục dễ dàng.

cach toi uu hoa sitemap website hieu qua cho seo - SEO tổng thể website
Cách Canonical URLs hoạt động

Cập nhật ngay khi trang có thay đổi quan trọng

Prodima chắc chắn sẽ có nhiều bạn bỏ qua cách tối ưu file Sitemap.xml cực kỳ đơn giản nhưng rất hiệu quả.

  • Đừng đánh lừa các công cụ tìm kiếm index lại những trang với “mẹo” cập nhật thời gian sửa đổi. Điều này không mang lại lợi ích gì cho website cũng như SEO nếu các bot phát hiện.

Giữ kích thước tệp càng nhỏ càng tốt

Sitemap của bạn càng nhỏ, bạn càng dễ dàng cho các BOT tìm kiếm khi thu thập và đánh chỉ mục.

Google và Bing đều tăng kích thước của các tệp Sitemap được chấp nhận từ 10 MB lên 50 MB vào năm 2016, nhưng vẫn nên giữ Sitemap của bạn càng gọn càng tốt và ưu tiên các trang đích chính của bạn.

Tạo nhiều Sitemap nếu Trang web > 50.000 URL

Bạn bị giới hạn ở 50.000 URL trên mỗi Sitemap.

Mặc dù điều này là quá đủ cho hầu hết các trang web, một số trang web sẽ cần tạo nhiều hơn một Sitemap.

Ví dụ, các trang web thương mại điện tử lớn có thể cần tạo thêm Sitemap để xử lý các trang sản phẩm bổ sung.

Đừng chú trọng vào Priority

Một vài Sitemap sẽ có thêm cột Priority (cài đặt ưu tiên), có vai trò thông báo cho các bot tìm kiếm trang nào trên website là quan trọng nhất. Tuy nhiên, cho đến nay thì chức năng này vẫn chưa được chứng thực rõ ràng.

Nhiều người đã tăng tải trên Twitter rằng thực tế Googlebot khi crawl thông tin đã bỏ qua những “ưu tiên” này!

Đừng tạo Sitemap “vô bổ”

Bạn cần ghi nhớ: Không phải trang web nào cũng cần Sitemap – vì các bot vẫn có thể tìm và index trang của bạn chính xác.

Như Prodima đã chia sẻ ở trên, mỗi Sitemap website chỉ chứa tối đa 50.000 URL. Nếu trang web của bạn rất ít khi cập nhật thì việc tạo Sitemap là không cần thiết.

Nếu bạn có hàng trăm nghìn trang hoặc khi xuất bản quá nhiều bài viết mới và muốn index nó càng sớm càng tốt thì phải tạo Sitemap. Về vấn đề tối ưu File XML Sitemap không quá phức tạp vì có nhiều Plugin hỗ trợ tự động cho quy trình của bạn.

Lời kết

Sitemap là bản đồ liên kết của trang web giúp các bots Google dễ dàng truy cập trang web từ đó tối ưu khả năng hiển thị trên công cụ tìm kiếm. Nếu website chưa có sitemap.xml và sitemap.html hãy tạo sitemap ngay để website nhanh chóng được Google index nhé.

Chúc các bạn thành công!

Nguyễn Văn Thiệu

"Trong suốt hơn 13 năm cung cấp dịch vụ website và SEO tôi nhận ra rằng để website bán được hàng và có được khách hàng thường xuyên thì trang web đó cần được chăm sóc một cách công phu từ nội dung, hình ảnh, tốc độ tải trang,.v.v..giống như việc chúng ta hít thở hàng ngày vậy"

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *