Top 5 công cụ kiểm tra liên kết gãy, Broken Link, Link 404 trong website

Posted on Công cụ SEO 142 lượt xem

Một trong những vấn đề nghiêm trọng của website đó là các liên kết gãy (404), nếu một website có quá nhiều các liên kết gãy sẽ ảnh hưởng tiêu cực đến trải nghiệm người dùng. Vậy làm thế nào để tìm các liên kết gãy trên website và xử lý các liên kết gãy đó? Trong bài viết này seotongthe.vn xin tổng hợp top 5 công cụ kiểm tra link gãy để giúp bạn có thể dễ dàng tìm ra các link gãy của website.

Broken link (liên kết gãy), hay còn được gọi với những cái tên khác như link breaking, link death (link chết) hoặc link rot, là thuật ngữ mô tả trạng thái của những liên kết khi trỏ đến một tài nguyên, một trang web, hoặc một máy chủ nào đó khác không còn tồn tại trên internet.
Như vậy, tất cả các liên kết mà người dùng không còn có thể truy cập được nữa đều có thể được coi là các broken link. Mã trạng thái html trả về của các liên kết này thường có dạng 4xx (ví dụ: mã trạng thái 404 – hãy lỗi truy cập 404).

Link gãy là link không tồn tại trên website. Không tồn tại nhưng vẫn được chèn trên website và điều hướng người xem nhấn vào những link này là điều hoàn toàn không hợp lý.

Nó sẽ gây ấn tượng không tốt cho người dùng.

Bên cạnh đó, Google thực hiện thu thập dữ liệu dựa trên các liên kết. Các link gãy gây ảnh hưởng đến quá trình thu thập của Google.

Do đó, việc tìm ra và fix các link gãy là công việc quan trọng. Người làm SEO sẽ kiểm tra trong giai đoạn SEO audit, hoặc người quản trị website sẽ thực hiện đánh giá theo từng chu kỳ.

lien ket gay hong - SEO tổng thể website

Vậy broken link sẽ được tạo ra khi nảo? Broken link có thể được sinh ra từ những nguyên nhân sau:

  • Cấu trúc trang web có thể đã bị thay đổi, làm thay đổi cấu trúc đường dẫn trên trang, khiến cho tất cả các trang trên site bị thay đổi đường dẫn. Lúc này, các đường dẫn cũ trên trang sẽ trở thành link gãy.
  • Một số trang tin tức (nhất là những trang báo lớn nước ngoài) chuyển chế độ công khai của một nội dung thành chế độ cần trả phí hoặc cần đăng nhập để có thể xem, khiến cho tất cả các trích nguồn của các trang khác về những bài báo này sẽ trở thành link gãy.
  • Liên kết bị hết hạn (outdated).
  • Sự thay đổi thường xuyên về tính riêng tư của bài viết trên các mạng xã hội, khiến các liên kết trích dẫn bài viết này trở thành broken link.
  • Liên kết chứa thông tin tạm thời của một người dùng (cụ thể như dữ liệu của phiên truy cập hoặc dữ liệu đăng nhập) sẽ trở thành liên kết gãy đối với người dùng khác do những thông tin này không được công khai một cách hợp lệ.
  • Người dùng bị chặn bởi các bộ lọc nội dung hoặc tường lửa (firewall).
  • Trong đó nguyên nhân do cấu trúc trang bị thay đổi là một trong số những nguyên nhân nguy hiểm nhất và sinh ra lượng link gãy nhiều nhất.

1. Công cụ kiểm tra liên kết gãy Xenu

1 21 - SEO tổng thể website

Xenu nói chính xác hơn nó là một công cụ dò tìm toàn bộ liên kết của một website bất kỳ chứ không phải chỉ có chức năng tìm liên kết bị lỗi 404. Cách thức hoạt động của nó là crawl liên kết theo kiểu bắc cầu từ trang này sang trang khác và trả thống kê đầy đủ cho bạn sau khi nó crawl xong. Tuy nhiên, do crawl theo kiểu đó nên nếu website bạn có nhiều trang thì sẽ khá mất thời gian để nó crawl xong đấy.

Khi phát hiện ra link bị 404, bạn có thể ấn chuột phải vào nó rồi chọn URL Properties để xem link đó nằm trong trang nào để bạn biết.

2. Công cụ ScreamingFrog Spider SEO

– Tải và cài đặt

Đầu tiên bạn hãy tải phần mềm và cài đặt trên máy tính tại http://www.screamingfrog.co.uk/seo-spider/.

1 22 - SEO tổng thể website

Phần mềm hỗ trợ trên Window, Mac và Ubuntu. Phiên bản miễn phí có giới hạn quét 500 Urls. Mua bản quyền bạn sẽ không bị giới hạn quét số lượng URLs (hữu ích đối với website lớn), cũng như mở rộng nhiều tính năng hơn.

– Quét một website

Bạn đã sẵn sàng thử quét một website chưa? tôi sẽ sử dụng một website làm mẫu. Nhập URL website vào trường ‘enter a URL to spider’ và nhấn ‘Start’.

1 23 - SEO tổng thể website

Nếu bạn muốn quét tên miền phụ (ví dụ một blog blog.website.com) bạn cần chọn vào Crawl All Subdomains trong phần cài đặt Configuration > Spider.

Tùy thuộc vào kích thước website, quá trình quét có thể mất vài phút.

Nếu Xenu chỉ có nhiệm vụ thu thập liên kết của website rồi trả về với các thuộc tính cơ bản thì ScreamingFrog sẽ có vai trò như một phần mềm hỗ trợ SEO tốt hơn vì nó có thêm các chức năng phục vụ việc SEO như phân tích các chỉ số của liên kết, kiểm tra liên kết, kiểm tra SEO Onpage,….

Phần mềm này tuy miễn phí nhưng nó sẽ giới hạn bạn thu thập tối đa là 500 liên kết. Nếu bạn muốn dùng nhiều hơn thì sẽ trả phí là £149.00 mỗi năm. Nhìn chung nếu bạn phụ thuộc nhiều vào nó thì cái giá đó không phải là đắt đỏ.

3. Công cụ LinkChecker

1 24 - SEO tổng thể website

Nếu bạn là một người dùng Linux thì có thể sử dụng công cụ này để kiểm tra liên kết gãy, nó hỗ trợ rất nhiều nền tảng như Windows, Ubuntu, Linux (hỗ trợ command line) và thậm chí là bạn có thể cài nó vào Web Server rồi sử dụng trên môi trường web. Nhìn chung nếu bạn đang có một máy chủ cỡ mạnh thì có thể cài cái này vô và kiểm tra cho nó nhanh.

4. Công cụ Google search console

  • Hệ điều hành: Môi trường web
  • Truy cập

Trong tài khoản Google Search Console sẽ ghi rõ là các URL trong website của bạn đang bị lỗi gì, thống kê tổng số link bị lỗi và liệt kê chi tiết cụ thể các link lỗi để bạn khắc phục.

Trong đó, có 3 lỗi khá phổ biến là:

1. URL bị đánh dấu noindex (Submitted URL marked ‘noindex’)

2. URL bị lỗi 404 (Submitted URL not found (404), Submitted URL seems to be a Soft 404)

3. URL bị lỗi thu nhập dữ liệu (Submitted URL has crawl issue)

Lý do của lỗi số 1 là dó các loại link như: link admin, link giỏ hàng (có chữ cart), link thanh toán (checkout), link cảm ơn đặt hàng (thankyou), link đăng ký affiliate,… không có giá trị tìm kiếm trên Google nên mặc định bộ source wesbite iTop của IMGroup để Noindex các link này

=> Do đó bạn có thể bỏ qua khi các link mà GSC thống kê đều thuộc các loại link trên

Lý do chính của lỗi số 2 và 3 là do trước đó bạn đã tạo các đường link được liệt kê trong GSC, nhưng sau đó đã thay đổi thành đường link khác hoặc dã xóa luôn link đó nên link không còn tồn tại nữa và bị báo lỗi 404.

Cách khắc phục là bạn có thể khai báo xóa các URL này với GSC để không còn bị báo lỗi nữa.

Hướng dẫn khai báo xóa URL bị lỗi bằng Google Search Console:

Bạn đăng nhập vào Google Search Console, ở mục Trạng thái lập chỉ mục (Coverage) sẽ thấy thống kê các lỗi mà GSC liệt kê

cach xoa link loi tren google search console - SEO tổng thể website

Bấm vào chi tiết từng lỗi để xem cụ thể các link bị lỗi

cach xoa link loi tren google search console 1 - SEO tổng thể website

Tiếp theo mở mục Xóa URL (Removal) trong 1 tab trình duyệt mới và click chọn Yêu cầu mới (New Request) để khai báo xóa URL

5. Công cụ Brokenlinkcheck.com

Ưu điểm:

  • Miễn phí kiểm tra đến 3000 trang: quá đủ cho hầu hết website;
  • Hoạt động nhẹ nhàng, êm ái, không ảnh hưởng đến tốc độ trang;
  • Cách dùng đơn giản, bạn chỉ việc nhập tên miền, gõ capcha xác nhận, rồi enter và ngồi đợi kết quả;
  • Tốc độ kiểm tra tốt, cỡ 70 – 90 trang / phút với tùy chọn mặc định;
  • Giao diện kết quả trả về rõ ràng, dễ quan sát, biết được link gãy đang nằm trong trang nào, thuộc đoạn mã nào, link text của liên kết gãy là gì;
  • Phân loại lý do không truy cập được, gồm: bad host, 404 & timeout;

Tóm kết

Trên đây là top 5 công cụ kiểm tra link gãy mình hay kiểm tra để rà soát link gãy của website, đây là việc làm thường xuyên của SEOER hoặc Webmaster giúp website tăng cao trải nghiệm người dùng. Nếu bạn không nắm được website của mình có bao nhiêu link gãy thì hãy sử dụng 1 trong 5 công cụ trên để kiểm soát link gãy trên web nhé.

Chúc bạn thành công!

Nguyễn Văn Thiệu

"Trong suốt hơn 13 năm cung cấp dịch vụ website và SEO tôi nhận ra rằng để website bán được hàng và có được khách hàng thường xuyên thì trang web đó cần được chăm sóc một cách công phu từ nội dung, hình ảnh, tốc độ tải trang,.v.v..giống như việc chúng ta hít thở hàng ngày vậy"

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *