Logo Zephyrnet

Sửa lỗi Sơ đồ trang web để lập chỉ mục tốt hơn các URL đã gửi

Ngày:

Tháng Tám 04, 2023
Đã đọc 19 phút

Vì vậy, bạn vừa tạo một sơ đồ trang web và gửi nó cho Google. Chúc mừng! Nhưng chờ đã, trạng thái sơ đồ trang web của bạn không phải là Sự thành công. Mặt khác, có thể báo cáo sơ đồ trang web của bạn có vẻ tốt, nhưng sau khi kiểm tra Lập chỉ mục trang báo cáo, Google dường như đã bỏ qua yêu cầu lịch sự của bạn và sẽ không lập chỉ mục một phần lớn các trang từ sơ đồ trang web của bạn. Bây giờ bạn đang tự hỏi liệu bạn có thể làm gì để cải thiện số liệu thống kê lập chỉ mục của mình hay không. 

Đừng tìm đâu xa vì bạn sẽ tìm thấy tất cả câu trả lời của mình trong bài đăng này.

Nếu bạn chưa có sơ đồ trang web và muốn tìm hiểu cách tạo sơ đồ trang web nổi bật, hãy xem qua khóa học về sự cố sơ đồ trang web giới thiệu. Bạn sẽ tìm hiểu tất cả về lợi ích của việc có sơ đồ trang web và khám phá một số phương pháp hay nhất về sơ đồ trang web. Dù sao thì điều quan trọng là phải tham khảo hướng dẫn, đặc biệt nếu bạn chưa biết gì thẻ được sử dụng cho hoặc nếu bạn vẫn chưa quen với sơ đồ trang web dành cho video hoặc tệp chỉ mục sơ đồ trang web.

Phần đầu tiên của bài đăng này liệt kê tất cả các lỗi tiềm ẩn mà bạn có thể gặp phải trong Google Search Console của mình. Sơ đồ trang web báo cáo. Nếu bạn đang khắc phục sự cố, bạn có thể sử dụng mục lục để điều hướng đến các lỗi mà bạn đang tập trung vào. 

Chương thứ hai của bài đăng này giới thiệu thông tin chi tiết để giúp bạn tận dụng tối đa sơ đồ trang web của mình. Những hiểu biết này bao gồm:

  • Cách tìm các trang rác trong sơ đồ trang web của bạn.
  • Nơi tìm các trang bị thiếu mà bạn có thể đã không đưa vào tệp sơ đồ trang web của mình.
  • Cách khuyến khích Google lập chỉ mục nhiều hơn các trang sơ đồ trang web của bạn. 

Rất khuyến khích bạn nghiên cứu kỹ chương thứ hai của bài đăng này. Làm theo các phương pháp hay nhất này có thể dẫn đến quá trình thu thập dữ liệu và lập chỉ mục hiệu quả hơn, điều này cuối cùng có thể nâng cao khả năng hiển thị trang web của bạn trên Google.

Sửa lỗi báo cáo Sơ đồ trang web

Khi bạn gửi sơ đồ trang web của mình tới Google, bạn sẽ có thể biết liệu nó có xử lý thành công tệp trong Trạng thái cột. Nếu tệp của bạn tuân theo tất cả các quy tắc, thì trạng thái của nó sẽ là Sự thành công. Trong chương này, chúng ta sẽ thảo luận về hai mã trạng thái khác, đó là Không thể tìm nạpCó lỗi.

Google gặp sự cố khi thu thập dữ liệu tệp sơ đồ trang web của bạn

Hãy bắt đầu với tình huống khó khăn nhất: Google không thể tìm nạp tệp sơ đồ trang web của bạn. Khi điều này xảy ra, bạn cần sử dụng Công cụ kiểm tra URL để tìm ra nguồn gốc của vấn đề.

Ảnh chụp màn hình báo cáo Sơ đồ trang web GSC

Trong tạp chí Kiểm tra URL phần, nhấp vào Kiểm tra trực tiếp và kiểm tra trạng thái tìm nạp Trang. Nếu nó nói Thành công, phải có lỗi từ phía Google. Trong trường hợp này, bạn nên liên hệ với Bộ phận hỗ trợ của Google

Khi liên hệ với nhóm hỗ trợ của Google và báo cáo sự cố, hãy cung cấp cho họ thông tin chi tiết có liên quan, bao gồm URL của sơ đồ trang web, bất kỳ thông báo lỗi nào gặp phải hoặc những quan sát bạn đã thực hiện. Google sẽ có thể hỗ trợ thêm cho bạn và cung cấp hướng dẫn về cách giải quyết vấn đề.

Ảnh chụp màn hình của công cụ Kiểm tra URL GSC

Nếu không có lỗi ở phía Google và không thể tìm nạp sơ đồ trang web của bạn, hãy đảm bảo rằng không có gì ngăn cản Google truy cập sơ đồ trang web của bạn. Đôi khi các lệnh robots.txt hoặc thậm chí các plugin CMS là nguyên nhân. Ngoài ra, hãy đảm bảo rằng bạn đã nhập URL sơ đồ trang web phù hợp đồng thời chú ý đến giao thức và www. 

Những kỹ thuật này có thể được áp dụng cho cả tệp chỉ mục sơ đồ trang và tệp đơn lẻ. Bây giờ, hãy xem cách giải quyết một số vấn đề về sơ đồ trang web XML phổ biến nhất.

Lỗi tệp chỉ mục sơ đồ trang web

Đôi khi, Google có thể tìm nạp tệp đã gửi của bạn và phát hiện lỗi. 

Khi sử dụng tệp chỉ mục sơ đồ trang web, Google phải xử lý tất cả các sơ đồ trang web riêng biệt được liệt kê trong đó để truy cập URL trang web của bạn. Nếu Google không thể xử lý các URL được liệt kê trên tệp chỉ mục sơ đồ trang web, bạn có thể nhận được thông báo URL không hợp lệ trong tệp chỉ mục sơ đồ trang web lỗi. Điều này thường có nghĩa là Google không thể tìm thấy một hoặc một số sơ đồ trang web của bạn do URL không đầy đủ hoặc lỗi chính tả. Tất cả các URL trỏ đến các sơ đồ trang web riêng lẻ trong tệp chỉ mục sơ đồ trang web của bạn phải đủ điều kiện, vì Google sẽ không thể tìm thấy chúng theo cách khác. 

Ngoài ra, tệp chỉ mục sơ đồ trang web của bạn không được liệt kê các tệp chỉ mục sơ đồ trang web khác, chỉ các tệp sơ đồ trang web. Nhưng nếu bạn vẫn liệt kê chúng, bạn sẽ nhận được một Định dạng chỉ mục sơ đồ trang web không chính xác: Chỉ mục sơ đồ trang web lồng nhau lỗi.

Lỗi cuối cùng chúng ta sẽ xem xét là Quá nhiều sơ đồ trang web trong tệp chỉ mục sơ đồ trang web. Điều này có thể xảy ra khi các trang web lớn liệt kê hơn 50,000 sơ đồ trang web trong một tệp.

Kích thước sơ đồ trang web và lỗi nén

Giới hạn kích thước áp dụng cho cả tệp chỉ mục sơ đồ trang web và sơ đồ trang web riêng lẻ. Kích thước tệp sơ đồ trang web không được vượt quá 50 MB khi không nén. Tệp cũng không được liệt kê hơn 50,000 URL vị trí (không tính các URL thay thế). Nếu bạn không tuân thủ các khuyến nghị này, bạn sẽ nhận được một Kích thước tệp sơ đồ trang web lỗi. 

Khi bao gồm các phiên bản được bản địa hóa của các trang trong sơ đồ trang web của bạn, điều quan trọng là phải hiểu cách Google tính các URL. Dựa theo John Mueller của Google, Google chỉ xem xét các vị trí dưới dạng các URL riêng lẻ trong sơ đồ trang web. Điều này có nghĩa là ngay cả khi bạn có nhiều vị trí xhtml:link cho các phiên bản ngôn ngữ khác nhau của một trang, chúng sẽ được tính là một URL xét về giới hạn kích thước sơ đồ trang web.

Một điều khác bạn nên biết là Google đếm trùng lặp URL là một trong sơ đồ trang web. Google có thể không coi đây là lỗi, nhưng bạn vẫn nên giữ cho sơ đồ trang web của mình không bị trùng lặp. Điều này là do các bản sao sẽ không giúp trang web của bạn được lập chỉ mục nhanh hơn, nhưng chắc chắn chúng sẽ thêm lộn xộn và có thể làm tăng kích thước của tệp sơ đồ trang web một cách dư thừa.

Mặc dù sơ đồ trang web của bạn không nên quá lớn, nhưng nó cũng không nên để trống. Nếu bạn gửi một Sơ đồ trang web trống, bạn chắc chắn sẽ nhận được một lỗi.

Tìm hiểu cách chia sơ đồ trang web thành nhiều tệp bằng cách đọc của chúng tôi hướng dẫn sơ đồ trang web cuối cùng.

Ngoài ra, trước đó trong bài viết này, chúng tôi đã đề cập rằng kích thước sơ đồ trang web phải nhỏ hơn 50 MB khi không nén, nhưng thực tế phổ biến là nén sơ đồ trang web để tiết kiệm băng thông. Một công cụ thường được sử dụng cho mục đích này là gzip, bổ sung phần mở rộng gz vào sơ đồ trang web. Nếu bạn gặp lỗi nén trong báo cáo Google Search Console, điều này có nghĩa là đã xảy ra lỗi trong quá trình nén. Đặt cược tốt nhất của bạn là thử lại.

Google gặp sự cố khi thu thập dữ liệu URL sơ đồ trang web của bạn

Google có thể không thu thập dữ liệu được một số URL bạn đã liệt kê trên sơ đồ trang web của mình vì một vài lý do khác nhau. Chúng ta hãy xem xét một số trong những cái phổ biến nhất.

  • Sơ đồ trang web chứa các URL đang bị chặn bởi robots.txt. T lỗi là một lỗi khá rõ ràng, đặc biệt là vì GSC sẽ chỉ cho bạn từng URL bị chặn. Tùy thuộc vào việc bạn có muốn lập chỉ mục các URL này hay không, bạn sẽ phải dỡ bỏ lệnh chặn hoặc xóa chúng khỏi sơ đồ trang web của mình.

Các lỗi khác, chẳng hạn như URL không thể truy cập, URL không được theo dõi, URL không được phép không phải là rõ ràng. Chúng ta hãy lướt qua từng người trong số họ.

  • Sản phẩm URL không thể truy cập lỗi có nghĩa là Google đã tìm thấy sơ đồ trang web của bạn tại vị trí được chỉ định nhưng không thể tìm nạp một số URL trong danh sách của bạn. Khi điều này xảy ra, hãy sử dụng Công cụ kiểm tra URL. Quy trình này giống như khi Google hoàn toàn không thể tìm nạp sơ đồ trang web của bạn.
  • Sản phẩm URL không được theo dõi lỗi xảy ra do bạn đã sử dụng các URL tương đối trên sơ đồ trang web của mình thay vì các URL đủ điều kiện hoặc đơn giản là do sự cố chuyển hướng. Một số hoạt động có thể dẫn đến các lỗi này bao gồm chuỗi chuyển hướng và vòng lặp, chuyển hướng tạm thời được sử dụng thay vì chuyển hướng vĩnh viễn cũng như chuyển hướng HTML và JS. 

    Cố gắng không giữ các URL được chuyển hướng trong sơ đồ trang web XML của bạn lâu hơn mức cần thiết. Ngay cả John Mueller của Google cũng đã làm rõ điểm này, nhiều lần đề cập rằng các URL cũ này nên được đưa vào tạm thời thay vì lâu dài. Tại một thời điểm, anh ấy đề nghị loại bỏ chúng trong vòng chưa đầy sáu tháng, nhưng những ngày này anh ấy đề nghị giữ chúng trong sơ đồ trang web không quá ba tháng.

    Việc bao gồm các URL được chuyển hướng trong sơ đồ trang web chắc chắn là một chiến lược hữu ích, nhưng nó có tác động tổng thể hạn chế. Đây là lý do tại sao bạn nên định kỳ xem xét và cập nhật sơ đồ trang web XML của mình để đảm bảo nó bao gồm các URL hiện tại và có liên quan. Sau đó, nhân đôi điều này bằng cách xóa các URL được chuyển hướng sau khung thời gian được đề xuất từ ​​​​một đến ba tháng.

    Google Search Console sẽ không chỉ định nguyên nhân chính xác của sự cố, vì vậy bạn sẽ phải sử dụng các công cụ khác để tìm ra vấn đề nào cần được khắc phục. Ví dụ, Kiểm tra trang web theo Xếp hạng SE có một sự tận tâm ← liên kết phần có thể giúp bạn kiểm tra trang web của bạn cho bất kỳ vấn đề chuyển hướng. 

    Nếu công cụ tìm thấy bất kỳ sự cố nào, bạn có thể truy cập tất cả thông tin cần thiết về từng lỗi bằng cách nhấp vào số trang bị ảnh hưởng. Điều này sẽ đảm bảo rằng bạn biết trang nào có lỗi và cách nó được liên kết với các trang khác của trang web.

Ảnh chụp màn hình phần Chuyển hướng trong Kiểm tra Trang web của Xếp hạng SE
  • Sản phẩm URL không được phép lỗi cho biết rằng sơ đồ trang web của bạn có các URL ở cấp cao hơn hoặc trên một miền khác với chính tệp sơ đồ trang web đó. Ví dụ: nếu sơ đồ trang web của bạn được đặt tại yoursite.com/category1/sitemap.xml và bạn đã thêm một trang vào trang đó tại yoursite.com/page1, Google sẽ không thể truy cập trang đó. 

    Nói về các miền khác nhau, hãy thận trọng vì Google coi HTTP và HTTPS, cũng như các phiên bản có www và không có www của trang web của bạn là các thực thể riêng biệt. Nếu gần đây bạn đã chuyển sang HTTPS, hãy đảm bảo tạo một sơ đồ trang web mới với các URL HTTPS.

    Công cụ Kiểm tra Trang web của Xếp hạng SE cũng sẽ cảnh báo bạn khi những trường hợp này xảy ra.

Ảnh chụp màn hình của phần Bảo mật trang web trong Kiểm tra trang web của Xếp hạng SE
  • Cuối cùng, còn một điều nữa có thể ngăn Google thu thập dữ liệu một trang—mã trạng thái HTTP không phải 200. Lỗi này được dán nhãn là Lỗi HTTP trong báo cáo Google Search Console và mã lỗi chính xác được chỉ định cho từng trường hợp. Bạn có thể tìm thấy tất cả các thông tin cần thiết trong HTTP phần Kiểm tra trang web của Xếp hạng SE.
Ảnh chụp màn hình phần Mã trạng thái HTTP trong Kiểm tra trang web của Xếp hạng SE

Google nghi ngờ bạn đã liệt kê các URL sai

Không bao gồm nội dung mỏng hoặc các trang 404 mềm khi quản lý sơ đồ trang web của bạn, vì làm như vậy có thể tác động tiêu cực đến SEO trang web của bạn: 

  • Nội dung mỏng đề cập đến các trang cung cấp nội dung hạn chế hoặc trùng lặp, cung cấp ít giá trị cho người dùng. Để giải quyết vấn đề này, hãy tiến hành cả đánh giá thủ công và phân tích dữ liệu để xác định các trang đó thiếu nội dung hoặc chất lượng. Ví dụ: bạn có thể sử dụng Google Analytics để phát hiện các trang có tỷ lệ tương tác thấp và lưu lượng truy cập tối thiểu, vì chúng có thể là ứng cử viên cho nội dung sơ sài. Sau khi được xác định, bạn có ba tùy chọn: cấm lập chỉ mục các trang này, cải thiện chất lượng của chúng thông qua việc làm lại nội dung hoặc xóa chúng hoàn toàn khỏi trang web của bạn. 
  • Trang 404 mềm trả lại mã trạng thái “200 OK” thay vì trạng thái “404 Không tìm thấy”, gây hiểu lầm cho cả công cụ tìm kiếm và người dùng. Để xác định các trang này, hãy truy cập Google Search Console's Lập chỉ mục trang báo cáo, trong đó các trang 404 mềm sẽ được liệt kê trong số các trang không được Google lập chỉ mục. Hãy xem kỹ các trang này và thực hiện hành động thích hợp. Nếu trang thực sự không tồn tại, hãy thiết lập trạng thái lỗi 404 hoặc 410 chính xác để cho biết trang đó không tồn tại. Mặt khác, nếu trang đó tồn tại và bạn muốn Google lập chỉ mục cho nó, hãy tập trung vào việc nâng cao nội dung của nó và sau đó gửi lại để lập chỉ mục.

Lỗi sơ đồ trang web dựa trên cú pháp

Thông thường, bạn sẽ không phải lo lắng về lỗi sơ đồ trang web dựa trên cú pháp nếu bạn tạo sơ đồ trang web bằng một trong các công cụ đặc biệt, vì chúng xử lý các thẻ và thuộc tính đúng cách. Tuy nhiên, nếu bạn đã tạo sơ đồ trang web của mình theo cách thủ công, bạn có thể gặp phải một trong các vấn đề sau: 

  • Giá trị thẻ không hợp lệ. Giá trị thẻ là những gì bạn đặt giữa thẻ mở và thẻ đóng, bao gồm cả URL giữa thẻ <loc> thẻ và ngày bạn chỉ định với sự trợ giúp của nhãn. Lỗi có thể xảy ra khi bạn đặt một giá trị hoặc định dạng dữ liệu không được chấp nhận trong sơ đồ trang web của mình.
  • Giá trị thuộc tính không hợp lệ. Giá trị thuộc tính là những gì bạn chỉ ra sau dấu bằng (=) trong dấu ngoặc kép. Ví dụ: chuỗi mã bên dưới liệt kê các phiên bản ngôn ngữ khác nhau của một trang trong sơ đồ trang web:
    https://example.com  

    Ở đây, "Luân phiên", “gb”“fr” là các giá trị thuộc tính, nhưng “gb” là sai vì bạn không thể chỉ ra mã quốc gia trong hreflangs. Thay vào đó, nó nên được ghép nối với một mã ngôn ngữ, như trong "en-gb."

  • URL không hợp lệ. Lỗi này gợi ý rằng bạn nên tìm lỗi chính tả trong các URL được liệt kê của mình. Đảm bảo rằng tất cả các URL trong sơ đồ trang web của bạn đều đủ điều kiện.
    2005-02-21 
    2005-02-21T18:00:15+00:00
  • Thiếu thuộc tính XMLThiếu thẻ XML lỗi cũng khá rõ ràng. Loại bỏ các thẻ và thuộc tính bắt buộc (bộ url>, , , “xmlns”) không phải là một tùy chọn—bạn cần liệt kê chúng để sơ đồ trang web của bạn hoạt động bình thường.
  • XML không hợp lệ: quá nhiều thẻ. Lỗi này sẽ xảy ra nếu bạn sử dụng một trong các thẻ nhiều lần, ví dụ: bạn liệt kê hai vị trí URL khác nhau hoặc hai ngày sửa đổi khác nhau cho một URL. Do đó, bạn sẽ phải xóa thẻ trùng lặp.
    <url>
    <loc>http://www.example.com/</loc>
    <lastmod>2021-01-01</lastmod>
    <lastmod>2021-02-01</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
    </url>
  • Không gian tên không chính xác. Không gian tên được liệt kê trong thẻ phải là một trong những giao thức được chấp nhận. Hiện tại, các giao thức sau được sử dụng:
sơ đồ trang tin tức xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9″
sơ đồ trang web video xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″
Sơ đồ trang web hình ảnh xmlns:image:=”http://www.google.com/schemas/sitemap-image/1.1″
sơ đồ trang web hreflang xhtml:hreflang:=”http://www.w3.org/1999/xhtml”
  • Nếu bạn sử dụng sai giao thức cho sơ đồ trang web của mình, bạn sẽ nhận được Định dạng không được hỗ trợ lỗi. Lỗi này cũng có thể xảy ra do nhiều lỗi cú pháp khác nhau, chẳng hạn như sử dụng dấu ngoặc kép không chính xác (chỉ chấp nhận dấu ngoặc kép đơn hoặc kép thẳng) hoặc thiếu thẻ mã hóa.
Ảnh chụp màn hình lỗi Định dạng không được hỗ trợ trong GSC

Ngoài ra còn có một số lỗi dành riêng cho sơ đồ trang web video: Hình thu nhỏ quá lớn/nhỏ, Vị trí video và vị trí trang phát giống nhau, URL vị trí video dường như là một URL trang phát. Tìm thêm chi tiết về những lỗi này tại đây.

Để đảm bảo tính chính xác và cấu trúc phù hợp của sơ đồ trang web XML của bạn, bạn phải biết cách ngăn ngừa các lỗi cú pháp và lỗi sơ đồ trang web phổ biến. Một trong những cách thuận tiện nhất để thực hiện điều này là sử dụng trình xác thực sơ đồ trang web XML như này. Các công cụ như thế này sẽ tạo báo cáo toàn diện, đánh dấu các phần hoặc dòng mã có vấn đề và cung cấp cho bạn thông tin chi tiết có giá trị về cách khắc phục các lỗi sơ đồ trang web phổ biến. 

Khi bạn đã sửa tất cả các lỗi sơ đồ trang web được đề cập trong báo cáo GSC của mình, hãy gửi lại sơ đồ trang web đã cập nhật của bạn và thông báo cho Google bằng cách ping URL sơ đồ trang web được cập nhật. Gửi yêu cầu NHẬN đến địa chỉ sau trong trình duyệt của bạn hoặc sử dụng dòng lệnh, chỉ định URL đầy đủ của sơ đồ trang web:

https://www.google.com/ping?sitemap=https://example.com/sitemap.xml

Điều này sẽ đảm bảo rằng bạn đang chủ động gắn cờ thay đổi trong tệp sơ đồ trang web, khiến Google chú ý và đẩy nhanh quá trình thu thập thông tin và lập chỉ mục. 

Để tìm hiểu thông tin chi tiết về việc lập chỉ mục trang web, hãy đọc phần này hướng dẫn đầy đủ.

Cân bằng tỷ lệ URL đã gửi so với tỷ lệ URL được lập chỉ mục

Sơ đồ trang web hoặc trạng thái tệp chỉ mục sơ đồ trang web của bạn có thể nói Sự thành công, nhưng điều đó không có nghĩa là công việc của bạn đã hoàn tất. Nhấn vào Xem Lập chỉ mục Trang bên cạnh số lượng URL được phát hiện để chuyển đến báo cáo tương ứng. Bạn có thể bắt đầu điều tra nó chỉ để phát hiện ra rằng không phải tất cả các trang bạn đã gửi đều được lập chỉ mục. 

Ảnh chụp màn hình của công cụ Lập chỉ mục Trang trong Google Search Console

Khi theo dõi trạng thái lập chỉ mục của các trang trên trang web của bạn trong Google Search Console, bạn có thể sử dụng tính năng bộ lọc sơ đồ trang web để dễ dàng chuyển đổi giữa sơ đồ trang web và danh mục trang.

Để truy cập tính năng này, hãy điều hướng đến Lập chỉ mục trang báo cáo trong Google Search Console, chọn bộ lọc Sơ đồ trang web, sau đó chọn danh mục hoặc sơ đồ trang web mong muốn mà bạn muốn kiểm tra. Đây là nơi bạn có thể xem các báo cáo sau:

  • Tất cả các trang đã biết: bao gồm tất cả các trang được Google phát hiện.
  • Các trang đã gửi: liệt kê các trang được gửi qua sơ đồ trang web của bạn
  • các trang chưa được gửi: đánh dấu các trang mà Google đã tìm thấy nhưng không được gửi qua sơ đồ trang web của bạn.

Giờ đây, việc các trang bị loại khỏi chỉ mục không chỉ ổn mà còn phổ biến. Điều này là do Google không thể thích và lập chỉ mục tất cả các trang trên trang web của bạn. Nhiều trang web có các trang mà quản trị viên web không muốn lập chỉ mục, chẳng hạn như khu vực quản trị, trang tiện ích, trang trùng lặp và trang thay thế. Nếu Google không lập chỉ mục các trang của bạn, có thể là do bạn đã thêm các trang không nên có trên sơ đồ trang web của mình. Google có thể không lập chỉ mục và thu thập dữ liệu trang vì chỉ thị ngăn lập chỉ mụchoặc Google có thể không chắc chắn về việc bạn có muốn trang được lập chỉ mục hay không, chẳng hạn như khi bạn thêm các trang không chính tắc vào sơ đồ trang web của bạn. Mỗi trường hợp này có thể được tìm thấy trong các tab khác nhau của Google Search Console Lập chỉ mục trang báo cáo, nhưng sẽ thuận tiện hơn nếu kiểm tra chúng bằng công cụ Kiểm tra trang web của Xếp hạng SE, công cụ này sẽ hiển thị bất kỳ sự cố thu thập dữ liệu nào trong Thu thập dữ liệu trong phần Báo cáo sự cố.

Ảnh chụp màn hình phần Thu thập dữ liệu trong Kiểm tra Trang web của Xếp hạng SE

Để giải quyết vấn đề về các trang không được lập chỉ mục, hãy xóa các trang không có chỉ mục và trang không chính tắc khỏi sơ đồ trang web của bạn. Ngoài ra, nếu các trang bị đánh dấu nhầm là trang bị cấm lập chỉ mục và không chính tắc, hãy khắc phục các vấn đề về thẻ sai để bật tính năng lập chỉ mục phù hợp. 

Sau khi bạn chắc chắn rằng sơ đồ trang web của mình không gửi các tín hiệu khó hiểu tới Google, hãy xem qua Lập chỉ mục trang báo cáo để tìm các trường hợp mà bạn và Google không đồng ý về giá trị của một trang.

  • Trong tạp chí tab được lập chỉ mục, bạn có thể khám phá các trang mà Google đã thu thập dữ liệu và lập chỉ mục thành công. Để truy cập danh sách này, hãy nhấp vào Xem dữ liệu về các trang được lập chỉ mục bên dưới biểu đồ trên trang tóm tắt của báo cáo. Hãy nhớ rằng báo cáo này chỉ liệt kê 1,000 URL, vì vậy không phải tất cả các trang đều có thể được đưa vào. Để có dữ liệu chi tiết hơn về một URL cụ thể, hãy chọn nó từ danh sách hoặc thêm nó vào thanh tìm kiếm ở đầu trang và nhấp vào nút Kiểm tra URL cái nút. Điều này sẽ cung cấp thêm thông tin chi tiết về cách Google nhận biết và xử lý URL đó.

    Ở cuối trang, bạn sẽ thấy Cải thiện giao diện trang phần trình bày các trang được lập chỉ mục có thể hưởng lợi từ các cải tiến. Hãy chú ý đến các trang đã được lập chỉ mục mặc dù có chỉ thị ngăn lập chỉ mục. Trong những trường hợp như vậy, phán đoán của Google có thể chính xác và bạn nên cân nhắc xóa thẻ ngăn lập chỉ mục khỏi các trang này hoặc xem lại cài đặt thẻ X-Robots của mình. Bạn có thể muốn thêm các trang này vào sơ đồ trang web của mình vì Google cho rằng những trang này có chất lượng cao. Bạn cũng nên đề phòng các trang trùng lặp đã được lập chỉ mục nhưng không xuất hiện trên sơ đồ trang web của bạn—những trường hợp như vậy thường phát sinh do việc xử lý thông số và phân trang kém. 

  • Trong tạp chí Không được lập chỉ mục tab, bạn sẽ tìm thấy các trang mà Google không thể lập chỉ mục vì nhiều lý do. Chúng có thể bao gồm lỗi lập chỉ mục hoặc loại trừ có chủ ý, chẳng hạn như các trang bị chặn bởi robots.txt, các trang 404 cũ hoặc các trang có thẻ ngăn lập chỉ mục hoặc thẻ chuẩn. 

    Các lý do URL không được lập chỉ mục được liệt kê trong Tại sao các trang không được lập chỉ mục bảng hiển thị trạng thái, nguồn và số trang bị ảnh hưởng. Dành thời gian để xem xét kỹ lưỡng từng trường hợp. Đặc biệt chú ý đến các trang chuẩn mà Google đã chọn không lập chỉ mục, vì công cụ tìm kiếm có thể tin rằng có những lựa chọn thay thế tốt hơn trên trang web của bạn. Nếu đánh giá của Google là chính xác, hãy xem xét sửa các thẻ chuẩn của bạn. Nếu bạn vẫn tin rằng trang nên được lập chỉ mục, hãy tập trung vào việc cải thiện nội dung, hồ sơ liên kết ngược và liên kết nội bộ để thuyết phục Google rằng trang đó có giá trị hơn các tùy chọn khác.

    Sau khi giải quyết vấn đề, bạn có thể thông báo cho Google và yêu cầu xác thực bản sửa lỗi bằng cách nhấp vào nút được cung cấp trong báo cáo vấn đề. 

Bạn nên xem xét kỹ hơn tất cả các trang này và sau đó xem bạn có thể làm gì để tăng giá trị của chúng—làm việc về nội dung, trải nghiệm người dùng, liên kết nội bộ, v.v.

Kết luận

Việc tạo sơ đồ trang web thật dễ dàng nhờ có rất nhiều công cụ tạo sơ đồ trang web hiện có trên thị trường. Tuy nhiên, nếu bạn chỉ sử dụng bất kỳ công cụ ngẫu nhiên nào và sau đó bỏ qua các phương pháp hay nhất về sơ đồ trang web, thì cuối cùng bạn có thể gửi vô số trang chất lượng thấp tới Google thông qua sơ đồ trang web của mình.

Chúng tôi hy vọng hướng dẫn này đã giúp bạn khắc phục mọi lỗi trên Google Search Console của bạn Sơ đồ trang web báo cáo. Chúng tôi khuyên bạn chỉ nên giữ các trang hấp dẫn, chất lượng cao trên sơ đồ trang web của mình trong khi xóa tất cả các trang có thể gây ấn tượng xấu trên công cụ tìm kiếm. Nếu bạn có bất kỳ câu hỏi nào còn lại, vui lòng liên hệ với chúng tôi qua trò chuyện trực tiếp hoặc liên hệ với chúng tôi trên Facebook.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img