Sự nguy hiểm của trùng lặp nội dung và cách tránh nó

Ngay cả khi nó không được thực hiện có chủ đích, nội dung trùng lặp có thể ảnh hưởng đến nỗ lực tối ưu hóa của bạn và làm ảnh hưởng đến trải nghiệm tìm kiếm cho khách hàng của bạn.

Tại Zendir, chúng tôi khuyên bạn nên đề phòng nội dung trùng lặp như một cách để tạo trải nghiệm người dùng tốt hơn cho người dùng của bạn và giúp bạn hiển thị trong tìm kiếm.

Vì ngày nay Google thông minh hơn bao giờ hết, nó biết cách phát hiện các hành vi lừa đảo so với việc thiếu kỹ năng SEO.

Với ý nghĩ này, hiểu biết vững chắc về vấn đề này là điều cần thiết đối với SEO. Khi bạn tránh hoặc sửa chữa các trang trùng lặp, khách hàng của bạn có thể xem nội dung bạn muốn họ xem. Ngoài ra, bạn phải thông báo với Google rằng bạn không lừa đảo.

Để giúp bạn bắt đầu, chúng tôi xác định nội dung trùng lặp, làm rõ hai loại theo Google và chia sẻ hậu quả của mỗi loại. Sau đó, chúng tôi sẽ chỉ cho bạn cách phát hiện 10 nguyên nhân cụ thể và giải quyết chúng.

nhân bản chim.

Nội dung trùng lặp là gì?

Nội dung trùng lặp là một thuật ngữ được sử dụng bởi các công cụ tìm kiếm như Google để mô tả hai loại vấn đề nội dung chính với các trang web:

  1. Các trang web có nhiều trang có nội dung giống nhau hoặc tương tự.
  2. Các trang web có nội dung đạo văn hoặc cóp nhặt từ các trang web khác.

Google xác định nội dung trùng lặp theo cách này:

Nội dung trùng lặp thường đề cập đến các khối nội dung thực sự trong hoặc trên các miền hoàn toàn khớp với nội dung khác hoặc tương tự đáng kể.

Nội dung trùng lặp có xấu không?

Nội dung trùng lặp không còn là vấn đề lớn như trước đây. Tuy nhiên, nó có thể ảnh hưởng đến cả trải nghiệm tìm kiếm và SEO của bạn. Bị bỏ lại một mình mà không có sự biện minh thích hợp, vâng, nội dung trùng lặp có thể gây hại. Hậu quả tồi tệ như thế nào tùy thuộc vào loại vấn đề bạn đang giải quyết.

Có Hình phạt Nội dung Trùng lặp không?

Không, Google không có hình phạt nội dung trùng lặp. Công cụ tìm kiếm cho biết :

Nội dung trùng lặp trên một trang web không phải là cơ sở để hành động trên trang web đó trừ khi có vẻ như mục đích của nội dung trùng lặp là để lừa đảo và thao túng kết quả của công cụ tìm kiếm.

Hơn nữa, Google nhận ra rằng nội dung trùng lặp xuất hiện trong một trang web “hầu hết không phải là nội dung lừa đảo về nguồn gốc.”

Tuy nhiên, vẫn có những hậu quả.

Hậu quả của Nội dung trùng lặp

Vì có hai loại nội dung trùng lặp chính, chúng ta sẽ thảo luận về cả hai và cách chúng có thể ảnh hưởng đến SEO và trải nghiệm tìm kiếm cho khách hàng của bạn.

Loại 1: Các trang có nội dung tương tự hoặc giống hệt nhau trong một trang web

Nếu trang web của bạn có các trang có nội dung giống hệt nhau, Google sẽ chọn trang tốt nhất cho kết quả tìm kiếm. Khi điều này xảy ra, các trang web bị coi là trùng lặp sẽ được lọc khỏi SERPs.

Mặc dù Google thấy điều này hữu ích cho người tìm kiếm – vì nó muốn hiển thị các trang có thông tin độc đáo – điều ngược lại có thể đúng với doanh nghiệp của bạn. Bạn có thể không đồng ý rằng trang mà Google chọn để hiển thị cho một truy vấn là trang tốt nhất. Và khách hàng của bạn có thể đang bỏ lỡ một trang mà họ đang tìm kiếm.

Ví dụ: một trang web thương mại điện tử có thể có một số URL cho “áo khoác trượt tuyết cho bé trai” – có thể là một trang danh mục cho áo khoác ngoài dành cho bé trai như “áo khoác – đồ trượt tuyết”, một trang khác cho “quần áo trượt tuyết – áo khoác – bé trai”, v.v. Nếu một trang web có các tùy chọn tìm kiếm theo từng khía cạnh (chẳng hạn như menu bộ lọc ở cột bên trái cho Thương hiệu, Kiểu, Màu sắc, v.v.), các trang khác nhau có thể dẫn đến thực sự có cùng nội dung.

Khi tất cả các trang này trông giống nhau, Google cho rằng điều đó là tốt. Tuy nhiên, sẽ chỉ có một người thực hiện việc cắt giảm. Các biến thể khác sẽ được lọc khỏi kết quả tìm kiếm.

Nếu trang web của bạn gặp vấn đề về nội dung trùng lặp,… chúng tôi thực hiện rất tốt việc chọn phiên bản nội dung để hiển thị trong kết quả tìm kiếm của chúng tôi.

–Trợ giúp của Google

Loại 2: Nội dung cóp nhặt hoặc spam trên các trang web khác nhau

Mặt khác, nội dung cóp nhặt được coi là thư rác và thuộc loại nội dung trùng lặp thứ hai. Các trang web có nội dung cóp nhặt có thể bị ảnh hưởng bởi hình phạt thủ công từ công cụ tìm kiếm.

Hoặc nó có thể bị tác động bởi các thuật toán của công cụ tìm kiếm nhắm mục tiêu vào nội dung chất lượng thấp và hạ cấp hoặc điều chỉnh thứ hạng xuống .

Bây giờ chúng ta đã có một cái nhìn tổng quan cơ bản, hãy xem xét nguyên nhân gây ra nội dung trùng lặp trên trang web của bạn và phải làm gì với nó.

Các vấn đề về nội dung trùng lặp phổ biến và cách khắc phục chúng

Trước khi chúng tôi đi sâu vào chi tiết cụ thể, video này tổng quan về cách giải quyết các vấn đề về nội dung dupe trên trang web của bạn.

Hãy xem xét một số tình huống có thể gây ra sự cố trên trang web của riêng bạn. Xin lưu ý rằng đây không phải là danh sách đầy đủ nhưng giải quyết các vấn đề phổ biến nhất hiện nay dẫn đến nội dung trùng lặp trên trang web của bạn.

Vấn đề 1: Phiên bản Dueling của Trang web của bạn

Bạn có thể tạo hai bản sao của trang web của mình trong chỉ mục tìm kiếm nếu bạn chưa cho các công cụ tìm kiếm như Google biết phiên bản trang web bạn muốn lập chỉ mục – phiên bản www (ví dụ: www.zendir.net) hoặc phiên bản không phải www (zendir.net).

Điều tương tự cũng có thể xảy ra nếu bạn có hai bản sao trang web của mình qua http: // và https: //.

Đây là cách xử lý: Bạn có thể mở Google Search Console và thực hiện việc này trong phần cài đặt. Tùy chọn phổ biến hơn thường là chuyển hướng phiên bản không có www sang phiên bản có www. Bạn cũng sẽ muốn thêm chuyển hướng 301 cấp miền từ phiên bản này sang phiên bản khác.

Vấn đề 2: Trang web dành cho thiết bị di động và Nội dung trùng lặp

Một số trang web có một trang web di động riêng biệt (so với một trang web đáp ứng, được khuyến nghị và tránh trùng lặp nội dung) và điều này yêu cầu duy trì hai trang web riêng biệt với các URL khác nhau. Nếu bạn đang ở trong trường hợp này, bạn có thể có các bản sao tương tự hoặc giống hệt các trang của mình.

Đây là cách xử lý: Tốt nhất, một trang web m-dot riêng biệt nên được chuyển đổi thành một thiết kế đáp ứng. Nếu không thể, hãy thiết lập thẻ <link> với các phần tử rel = ”canonical” và rel = ”alternate” để cho Google biết mối quan hệ giữa hai phiên bản trang của bạn. Đảm bảo bạn chuyển hướng chính xác bằng cách sử dụng hướng dẫn của Google tại đây .

Vấn đề 3: Dấu gạch chéo trên URL

Khi bạn có dấu gạch chéo ở cuối URL và cùng một trang tồn tại dưới URL không có dấu gạch chéo thì về cơ bản bạn đang tạo hai trang.

Ví dụ: www.zendir.net/blog/duplicate-content/ so với  www.zendir.net/blog/duplicate-content

Đây là cách xử lý: Giống như vấn đề có www và không phải www, bạn sẽ muốn chọn định dạng URL ưa thích và gắn bó với nó. Sau đó, 301 chuyển hướng các URL trùng lặp tồn tại đến URL ưa thích. Nhất quán là chìa khóa, vì vậy hãy đảm bảo rằng các liên kết điều hướng nội bộ của bạn trỏ đến các phiên bản URL chính xác.

John Mueller của Google đã gửi một tweet với một biểu đồ tiện dụng để tóm tắt khi các dấu gạch chéo theo sau là vấn đề:

Tôi nhận thấy có một số nhầm lẫn xung quanh dấu gạch chéo trên URL, vì vậy tôi hy vọng điều này sẽ hữu ích. tl; dr: gạch chéo trên root / hostname = không thành vấn đề; chém ở nơi khác = không quan trọng (chúng là các URL khác nhau) pic.twitter.com/qjKebMa8V8

– 🍌 John 🍌 (@JohnMu) ngày 19 tháng 12 năm 2017

Vấn đề 4: Nội dung trùng lặp từ CMS của bạn

Hệ thống quản lý nội dung (CMS) của bạn có thể đang tạo ra nội dung trùng lặp. Ví dụ: một số nền tảng thương mại điện tử tạo URL với danh mục sản phẩm có thể gây ra vấn đề nội dung trùng lặp.

Đây là cách xử lý: Một số CMS vốn đã tạo ra các vấn đề về nội dung mà không thể khắc phục được. Trong các trường hợp khác, tùy thuộc vào cách nội dung bị trùng lặp, bạn có thể thực hiện các bước để cải thiện tình hình. Ví dụ: bài báo Search Engine Land này đưa ra lời khuyên về cách xử lý nội dung trùng lặp trong Magento.

Vấn đề 5: Sao chép thông tin meta

Thông tin meta trên một trang (tiêu đề, mô tả) là một trong những khối nội dung văn bản đầu tiên mà công cụ tìm kiếm gặp phải. Khi bạn có nhiều trang có thông tin meta giống nhau hoặc tương tự, chúng có thể trông giống như nội dung trùng lặp.

Dưới đây là cách xử lý: Đảm bảo mỗi trang của bạn có một tiêu đề hoặc mô tả meta duy nhất nếu có thể. siteliner có trình kiểm tra nội dung trùng lặp có thể cảnh báo bạn khi các trang có thông tin meta giống hệt nhau. Bạn chỉ cần dán url webstie của mình vào và check như hình:

siteliner

Sau đó check ở phần như hình dưới:

Duplicate Content

Vấn đề 6: Nội dung tương tự

Nội dung tương tự đề cập đến các trang trên trang web của bạn có cùng chủ đề theo những cách khác nhau. Các công cụ tìm kiếm như Google có thể không xem xét nội dung trùng lặp này. Nhưng nó sẽ chọn trang nào sẽ được hiển thị trong kết quả tìm kiếm (mỗi truy vấn) và lọc ra những trang khác. Bạn sẽ không thấy tất cả chúng cạnh tranh.

Dưới đây là cách xử lý: Thực hiện kiểm tra các trang trên trang web của bạn có giống nhau về chủ đề hay không. Tìm hiểu những gì đã được xếp hạng và nhận được lưu lượng truy cập. Sau đó, hãy xem xét việc kết hợp nội dung (và thực hiện chỉnh sửa chất lượng). Gấp một số trang không hoạt động đó vào các trang đã hoạt động (với chuyển hướng 301 ).

Vấn đề 7: Nội dung văn bản gốc

Nội dung bản soạn sẵn có thể bao gồm văn bản giống nhau trên mọi trang. Ví dụ: một số ngành nhất định có tuyên bố từ chối trách nhiệm bắt buộc về mặt pháp lý phải được hiển thị trên mọi trang. Hoặc bạn có thể có văn bản điều khoản và điều kiện.

Google hiểu rằng loại văn bản soạn sẵn này có thể được yêu cầu và không tính nó vào một trang web. Điều này đặc biệt có thể xảy ra đối với các loại trang YMYL (Tiền của bạn hoặc Cuộc sống của bạn). Tuy nhiên, bạn vẫn cần nội dung độc đáo để cung cấp giá trị cho người dùng và làm cho trang của bạn nổi bật trong tìm kiếm.

Dưới đây là cách xử lý: Nếu có thể, hãy tạo các trang web riêng lẻ cho tất cả nội dung bản soạn sẵn của bạn. Sau đó, tạo một baclink đến các trang đó trên trang web, chẳng hạn như ở chân trang.

Trường hợp bạn phải bao gồm một đoạn văn bản tuyên bố từ chối trách nhiệm trong phần nội dung do các yêu cầu pháp lý, hãy đảm bảo có nội dung độc đáo hơn tương ứng phía trên nội dung đó trên trang.

Vấn đề 8: Các trang trùng lặp với các thông số

Một số trang web có nhiều phiên bản trang do các tham số, là các mã được nối vào cuối URL. Ví dụ: các màu sắc hoặc kích thước sản phẩm khác nhau có thể phân phối cùng một trang chỉ với những thay đổi nhỏ. Hoặc ID phiên của người dùng có thể được thêm vào URL dưới dạng tham số. Khi chúng được sử dụng trong các liên kết đến trang web, các công cụ tìm kiếm có thể tìm và lập chỉ mục các phiên bản trùng lặp.

Đây là cách xử lý: Google khuyên bạn nên chặn thu thập thông tin nội dung được tham số hóa bằng công cụ Xử lý tham số . Điều này cho phép bạn chỉ định cách bạn muốn Google xử lý các tham số URL trên trang web của bạn.

Vấn đề 9: Mô tả sản phẩm

Sử dụng mô tả nhà sản xuất cho nội dung sản phẩm có thể tạo ra các vấn đề sao chép giống hệt nhau. Những đoạn văn tương tự có thể được sử dụng trên các trang bán hàng trên hàng trăm trang web.

Các công cụ tìm kiếm như Google có thể mong đợi rằng các mô tả sản phẩm sẽ giống nhau hoặc tương tự. Nhưng nếu các trang của bạn không mang lại bất kỳ giá trị duy nhất nào cho người tìm kiếm, chúng sẽ bị lọc ra khỏi kết quả tìm kiếm.

Đây là cách xử lý: Nếu Google mong đợi điều này, bạn nghĩ sẽ không có vấn đề gì. Nhưng tốt nhất là viết lại mô tả sản phẩm để làm cho chúng độc đáo hơn hoặc thêm ít nhất 200 từ độc đáo hơn trên trang để thể hiện kiến ​​thức chuyên môn và cung cấp thêm chi tiết về sản phẩm.

Đây có thể là công việc tẻ nhạt, vì vậy hãy ưu tiên các trang sản phẩm có lợi nhất của bạn và làm theo cách của bạn qua danh sách. Chúng tôi đã thấy loại hình đầu tư nội dung này mang lại lợi nhuận SEO rất lớn. Để biết thêm chi tiết, hãy xem bài viết của chúng tôi về thin content.

Vấn đề 10: Cung cấp nội dung

Khi bạn cung cấp nội dung của mình trên các trang web có thẩm quyền khác, trang web xếp hạng cho nội dung của bạn có thể không phải của riêng bạn.

Phiên bản mới nhất của Nguyên tắc đánh giá chất lượng tìm kiếm của Google (tháng 12 năm 2019) có nội dung này trên Trang 40:

Chúng tôi không coi nội dung được cấp phép hợp pháp hoặc cung cấp là “sao chép” (xem tại đây để biết thêm về cung cấp web). Ví dụ về nội dung được cung cấp ở Hoa Kỳ bao gồm các bài báo của AP hoặc Reuters.

Nói cách khác: cung cấp nội dung có vị trí của nó. Bài báo này có rất nhiều thông tin tốt về việc hiểu hợp đồng.

Đây là cách xử lý: Cách dễ nhất để nội dung của bạn vẫn được hưởng lợi từ SEO khi được cung cấp trên các trang khác là triển khai rel = ”canonical” . Điều này có thể chuyển PageRank từ nguồn cung cấp sang nguồn ban đầu: nội dung của bạn.

Khi điều đó không được phép, Google đề xuất các biện pháp sau:

  • Chặn một trang được lập chỉ mục bằng cách bao gồm thẻ meta ngăn lập chỉ mục .
  • Thêm một liên kết trở lại bài viết gốc trong phần nội dung của bài báo được cung cấp thông tin.

Các vấn đề về nội dung trùng lặp có bổ sung và cách giải quyết chúng

Khi các trang web sao chép nội dung của một trang khác, điều này thường được gọi là cóp nhặt. Nhiều người cho rằng đây là một dạng nội dung trùng lặp nhưng trên thực tế, đó là thư rác và một số đạo văn kiểu cũ.

Trong video này, đại diện của Google giải quyết nội dung trùng lặp là spam.

Bạn có thể tìm hiểu xem nội dung trang web của mình có tồn tại ở những nơi khác trên web hay không bằng cách sử dụng công cụ kiểm tra đạo văn như CopyScape .

Ví dụ: bạn cũng có thể thực hiện tìm kiếm các phần của nội dung có và không có dấu ngoặc kép trong Google để phát hiện nội dung trùng lặp.

Lưu ý rằng Mueller của Google nói rằng nội dung cóp nhặt sẽ không thành vấn đề trừ khi trang của trang khác được xếp hạng cho các truy vấn bạn quan tâm.

Dưới đây là cách xử lý: Nếu nội dung của bạn đã bị cắt, hãy làm theo các bước sau:

  1. Kiểm tra xem trang có tín dụng cho trang của bạn không. Nó có thể có lệnh noindex trên trang; một thuộc tính chuẩn trỏ đến nội dung gốc của bạn; văn bản nói rằng nó đã được xuất bản trên trang web của bạn; hoặc một liên kết. Nếu vậy, bạn có thể không phải làm gì cả.
  2. Nếu trang không cấp cho bạn, hãy liên hệ với quản trị viên web để yêu cầu họ gỡ trang xuống. Ở Hoa Kỳ, có một luật mà bạn có thể tham khảo được gọi là Đạo luật Bản quyền Thiên niên kỷ Kỹ thuật số . Đôi khi cần một chút kiên trì.
  3. Gửi yêu cầu gỡ xuống với Google (thêm chi tiết tại đây ).
  4. Nếu vấn đề đang lan tràn (nói cách khác, rất nhiều trang web đã lập chỉ mục nội dung của bạn vào thời điểm này), thì hãy viết lại nội dung của riêng bạn để làm cho nó trở nên độc đáo và thậm chí còn tốt hơn trước đây.
  5. Bạn cũng có thể xem xét các plugin WordPress có thể giúp chống lại những kẻ phá hoại liên tục.

Nếu trang web của bạntrang có vẻ như đã sao chép nội dung từ một trang web khác, bạn có thể gặp sự cố xếp hạng.

Như đã đề cập trước đó, trang của bạn có thể sẽ bị lọc ra khỏi kết quả tìm kiếm. Bạn có thể nhận được hình phạt thủ công từ Google (đặc biệt nếu vấn đề phổ biến trên trang web của bạn) hoặc thậm chí bị loại khỏi chỉ mục (trường hợp nghiêm trọng). Bất kể điều gì, nó sẽ không phản ánh tốt về chuyên môn, tính có thẩm quyền và độ tin cậy của trang web của bạn ( các chỉ số EAT của Google về một trang web chất lượng).

Trong trường hợp này, tốt nhất là xóa nội dung spam và sau đó tạo nội dung độc đáo, nguyên bản. Với hình phạt thủ công, bạn cần phải gửi trang web của mình để được xem xét lại sau khi bạn đã thực hiện những cải tiến đó.

Hiểu rõ về nội dung trùng lặp là cách duy nhất để ngăn chặn và sửa chữa mọi vấn đề hiện có trên trang web của bạn.

Cách kiểm tra backlink: 4 bước loại bỏ liên kết xấu

Cách kiểm tra backlink kém chất lượng

Như đã giải thích trong bước hướng dẫn SEO trước, việc có đúng loại backlink sẽ giúp trang web của bạn tăng thứ hạng trên công cụ tìm kiếm. Nhưng loại sai có thể tạo ra một cơn ác mộng SEO nếu trang web của bạn bị phạt Google Penguin .

Theo dõi hồ sơ liên kết của trang web của bạn  (tức là danh sách đầy đủ các liên kết trỏ đến trang web của bạn từ các trang web khác) là một chiến lược SEO phòng thủ khôn ngoan. Khi bạn biết cách tìm các backlink đến trang web của mình, bạn có thể đánh giá chúng và loại bỏ những liên kết xấu khỏi hồ sơ liên kết của mình. Thuật toán Penguin của Google phân tích hồ sơ liên kết của một trang web và nếu quá nhiều liên kết đến của nó trông đáng ngờ, thứ hạng của trang web có thể giảm mạnh. Cho dù bạn đang cố gắng phục hồi sau hình phạt Penguin hay chủ động bảo vệ trang web của mình, điều quan trọng là phải theo dõi các backlink – có thể không phải là “giống như diều hâu”, nhưng thường xuyên – và giữ cho hồ sơ liên kết của bạn sạch sẽ.

Trong bài học này, bạn sẽ tìm hiểu quy trình tìm và xóa các liên kết có hại khỏi hồ sơ liên kết của mình:

LƯU Ý: Chúng tôi đã bao gồm các liên kết đến các hướng dẫn chi tiết sẽ giúp bạn thực hiện từng bước trong quy trình. Khi bạn gặp sự cố hệ thống, việc lược bỏ liên kết sẽ trở thành một phần thường xuyên trong quá trình bảo trì trang web SEO liên tục của bạn. 

# 1: Giám sát Backlinks

Menu liên kết của Google Search Console

Bạn có biết cách tìm các backlink cho trang web của mình không? Trước khi bạn có thể bắt đầu quá trình cắt bỏ liên kết, bạn cần kiểm kê các backlink hiện tại của mình . Bạn có thể sử dụng nhiều công cụ kiểm tra backlink để theo dõi các backlink và tìm hiểu những trang nào đang liên kết đến trang của bạn. Bắt đầu một bảng tính với tất cả các URL trang liên kết trong một cột.

Google Search Console (trước đây được gọi là Công cụ quản trị trang web) là một nơi tốt để bắt đầu thu thập dữ liệu liên kết của bạn. Chọn “Liên kết đến trang web của bạn” trong menu Lưu lượng tìm kiếm, như được hiển thị bên trái.

Rất tiếc, hồ sơ liên kết của bạn trong Google Search Console thường không hoàn chỉnh hoặc không cập nhật. Để có được danh sách mới hơn, đầy đủ hơn để bắt đầu kiểm tra liên kết của bạn, hãy thêm dữ liệu được thu thập từ một số nguồn theo dõi liên kết: Bing Webmaster Tools, Majestic SEO Site Explorer, Moz’s Open Site Explorer, Ahrefs

# 2: Đánh giá các liên kết

Khi bạn đã học được cách tìm các backlink và biên soạn hồ sơ liên kết của mình, bạn sẽ cần đánh giá chất lượng của từng liên kết và quyết định những liên kết nào cần được xóa . Đánh giá các backlink là một công việc kinh doanh tẻ nhạt. Sau một thời gian, bạn có thể nhận ra một liên kết “vô cơ” (không tự nhiên) chỉ bằng URL của nó, nhưng  đối với hầu hết chúng, bạn sẽ cần nhấp và kiểm tra trang web có liên kết đó. Nếu nó trên một trang web spam hoặc chất lượng thấp, bạn không muốn liên kết với nó.

Bạn có thể tạo hệ thống tính điểm của riêng mình để đánh giá giá trị liên kết hoặc sử dụng Xếp hạng trang như một phép đo chất lượng. Đối với các hệ thống tính điểm nâng cao hơn, chúng tôi khuyên bạn nên sử dụng điểm xếp hạng của Majestic SEO được gọi là Trust Flow và Citation Flow. MozRank có một chỉ số chất lượng tương tự. Trong bảng tính của bạn, hãy tạo các cột để theo dõi thông tin liên kết, thông tin liên hệ của chủ sở hữu trang web hoặc quản trị viên web và các bản ghi thư từ.

Phát triển quá mức với các liên kết xấu

Ảnh của  Paul Williams  (CC BY 2.0) , đã sửa đổi 

# 3: Loại bỏ các liên kết xấu (Liên kết cắt tỉa)

Bây giờ bạn đã biết những liên kết nào nên được xóa, bạn sẽ cần  tạo một mẫu email mà bạn có thể gửi cho chủ sở hữu trang web yêu cầu xóa liên kết . Email phải giải thích bạn là ai và bạn đang cố gắng hoàn thành điều gì, với thông tin cụ thể, bao gồm các liên kết, cần thiết để chủ sở hữu trang web xử lý yêu cầu xóa liên kết của bạn. Ghi lại ngày yêu cầu cắt bỏ liên kết đầu tiên này trong bảng tính của bạn để bạn có thể theo dõi và xác minh xem liên kết đã bị xóa hay chưa. Gửi yêu cầu thứ hai và thứ ba, nếu cần. Sử dụng bảng tính của bạn để theo dõi mọi thứ vì bạn sẽ cần tài liệu về những nỗ lực của mình khi giao tiếp với Google.

Để cắt bớt một liên kết, bạn muốn quản trị viên web 1) xóa liên kết không mong muốn khỏi trang web của họ hoặc 2) thêm  rel = ”nofollow”  vào thẻ liên kết để công cụ tìm kiếm không tính nó.

# 4: Từ chối tên miền liên kết là giải pháp cuối cùng

Trong trường hợp các yêu cầu cắt bỏ liên kết của bạn bị bỏ qua hoặc bị từ chối, tất cả sẽ không bị mất! Phương án cuối cùng, bạn có thể gửi yêu cầu từ chối đến GoogleBing  với nội dung về cơ bản là “Tôi không muốn những liên kết này, nhưng tất cả nỗ lực của tôi để xóa chúng đều thất bại, vì vậy hãy bỏ qua chúng”.

Yêu cầu từ chối backlink là phù hợp khi bạn đã nhiều lần cố gắng yêu cầu trang web xóa các liên kết nhưng vô hiệu. Bảng tính của bạn chứa tất cả các chi tiết và hồ sơ thư từ cung cấp cho bạn bằng chứng bạn cần để trực tiếp truy cập các công cụ tìm kiếm (và hy vọng tránh được hình phạt của Google Penguin). Việc từ chối các backlink chỉ nên được thực hiện một cách có chọn lọc và cẩn thận, vì vậy hãy đọc tất cả các mẹo của chúng tôi (hoặc liên hệ với chúng tôi để được trợ giúp về việc đánh giá hình phạt và cắt bỏ liên kết ).  

Cách từ chối backlink xấu (kém chất lượng)

Google đã đặt tên cho nội dung và liên kết là hai yếu tố xếp hạng hàng đầu ảnh hưởng đến hiệu quả hoạt động của một trang web trong kết quả tìm kiếm không phải trả tiền. Do đó, các liên kết có một lịch sử hoang dã về việc bị thao túng và gửi thư rác, khiến việc mua lại của chúng trở nên rủi ro nhưng vẫn quan trọng.

Bản cập nhật tháng 9 năm 2016 của Penguin , thuật toán phân tích liên kết của Google, đã tập trung rõ nét vào sự tinh vi mà Google đánh giá các liên kết. Penguin hiện chạy trong thời gian thực như một phần của thuật toán xếp hạng cốt lõi của Google. Vì nó có thể nhận ra hầu hết các liên kết xấu, Penguin thời gian thực mới này tìm cách bỏ qua chúng thay vì trừng phạt các trang web.

Tuy nhiên, theo kinh nghiệm quản lý SEO cho khách hàng, chúng tôi đã phát hiện ra nhiều trường hợp khi một hồ sơ liên kết chất lượng thấp vẫn gây hại cho trang web. Trong những trường hợp này, chúng tôi phải đánh giá chặt chẽ mọi liên kết của chúng và trung thực về giá trị của nó đối với thương hiệu.

Công cụ từ chối liên kết của công cụ tìm kiếm là cần thiết trong môi trường phạt liên kết ngày nay. Những công cụ này cắt đứt mối quan hệ giữa một trang web và các liên kết trỏ vào nó mà các công cụ có thể coi là vết đen. Như với tất cả các công cụ mạnh mẽ, các công cụ từ chối đi kèm với các câu hỏi về việc sử dụng đúng cách và các mối lo ngại về việc lạm dụng.

Bing-Google-từ chối-liên kết-công cụ

Hãy nói về lý do, lý do và cách sử dụng của các công cụ từ chối liên kết của công cụ tìm kiếm. Hướng dẫn này cung cấp các bước về cách từ chối liên kết cho cả Google và Bing. Nhận bản đồ rõ ràng về các phương pháp hay nhất của công cụ liên kết từ chối, bao gồm:

  • Làm thế nào để biết bạn có cần công cụ từ chối của công cụ tìm kiếm hay không và lợi ích của việc sử dụng chúng
  • Một số nhược điểm và hạn chế của các công cụ liên kết từ chối ngày nay
  • Cách tạo và gửi tệp từ chối tới Google cũng như cách sử dụng công cụ Liên kết từ chối từ Bing

DisavowFiles là một cơ sở dữ liệu miễn phí có nguồn lực từ cộng đồng và công cụ SEO cung cấp cho người dùng cái nhìn sâu sắc về các backlink trên trang web của họ. Công cụ này là điểm nổi bật của SMX Advanced khi nó ra mắt vì nó cung cấp dữ liệu bị thiếu trước đây giúp đơn giản hóa quá trình đánh giá backlink và từ chối.


Tệp từ chối giúp bạn như thế nào

Backlink chất lượng là một yêu cầu của thứ hạng tìm kiếm lành mạnh. Nhưng rõ ràng từ miệng của các công cụ tìm kiếm rằng bạn không thể đi xa nếu trang web của bạn được liên kết với các liên kết gửi đến lạc đề hoặc spam. Mặc dù điều quan trọng là thu hút các liên kết tốt, nhưng việc loại bỏ các liên kết xấu cũng quan trọng không kém. Đây là lý do tại sao cắt bỏ liên kết  là một nhiệm vụ quan trọng của SEO.

Tuy nhiên, một vấn đề nảy sinh khi bạn bị mắc kẹt với một vài backlink xấu. Nếu bạn không thể gỡ bỏ chúng, làm cách nào để bạn tránh bị công cụ tìm kiếm phạt cho những backlink này? May mắn thay, cả Google và Bing đều có câu trả lời: mỗi công cụ tìm kiếm đều có một công cụ để từ chối liên kết hoặc cho họ biết những backlink mà bạn muốn họ bỏ qua.

Các công cụ liên kết từ chối của công cụ tìm kiếm có thể giúp trang web của bạn theo nhiều cách.

Đầu tiên, nó có thể cải thiện hồ sơ liên kết đến của bạn. Từ chối một backlink chất lượng thấp về cơ bản sẽ chặn nó khỏi sự xem xét của các công cụ tìm kiếm. Nếu công cụ tìm kiếm cảm thấy rằng một liên kết chất lượng thấp đang kéo yếu tố tin cậy của bạn xuống, thì việc loại bỏ liên kết đó thông qua từ chối có thể giúp trang web của bạn lấy lại một số niềm tin đó. Trên thực tế, chúng tôi đã thấy rằng việc loại bỏ các backlink chất lượng thấp có thể mang lại kết quả tích cực theo cách tương tự như thu hút các liên kết chất lượng đến trang web của bạn.

Một lợi ích khác khi sử dụng công cụ này là cơ hội phát hiện ra SEO tiêu cực. Trong khi thu thập thông tin liên kết, bạn có thể tìm thấy các liên kết nhân tạo trỏ đến trang web của mình mà bạn không tham gia tạo. Nếu bạn đang thực sự nhắm mục tiêu tiêu cực bởi sự cạnh tranh của bạn, yêu cầu độc đáo để gỡ bỏ các liên kết có thể không làm việc. Mặc dù hiếm gặp, nhưng SEO tiêu cực là một ví dụ tuyệt vời khi các công cụ từ chối liên kết có thể ngăn các liên kết chất lượng kém gây hại cho trang web của bạn.


Chủ sở hữu trang web không có thông tin chi tiết về dữ liệu từ chối do Google và Bing nắm giữ. SEO có thể bị bỏ lại mà không có câu trả lời…

Bạn có bị ảnh hưởng bởi hình phạt Penguin của Google không?

Bạn có phải là nạn nhân của SEO tiêu cực?

Làm thế nào để bạn biết nếu bạn có các backlink mà người khác đã từ chối?

Bạn có muốn biết nếu một trang web khác đã từ chối các trang của bạn?


Ai Cần Tệp Từ chối?

Google đã nói rằng không phải ai cũng cần công cụ liên kết từ chối. Công cụ tìm kiếm gọi nó là một công cụ nâng cao và cảnh báo người dùng chỉ sử dụng công cụ này nếu “… bạn tin rằng bạn có một số lượng đáng kể các liên kết spam, giả tạo hoặc chất lượng thấp trỏ đến trang web của bạn và nếu bạn tin rằng các liên kết đó gây ra vấn đề cho bạn. “

Vậy bạn có thực sự cần công cụ này không?

Câu trả lời ngắn gọn: có thể. (Xin lỗi, Google.)

Tại sao? Có nhiều lý do khiến việc từ chối liên kết có thể là lựa chọn phù hợp cho bạn, trong đó lý do đầu tiên là: “Không phải ai cũng có một hồ sơ liên kết hoàn hảo,” Robert Ramirez, cựu giám đốc SEO tại Bruce Clay, Inc.

Ramirez cho biết hầu hết các trang web ngày nay đều có tệp từ chối. Mặc dù ban đầu được hình dung như một phương sách cuối cùng, các công cụ từ chối đã trở thành bước cuối cùng bắt buộc trong quy trình cắt bỏ liên kết hoàn chỉnh. Như người sáng lập Bruce Clay của chúng tôi nói: “Mọi người đều có một liên kết yếu nhất. Tất cả chúng ta đều có những liên kết mà chúng ta mong muốn sẽ biến mất ”.

Sau khi ra mắt Penguin 4.0, đại diện của Google đã xác nhận tính hữu ích của việc từ chối liên kết trong việc dọn dẹp backlink.

Khi bạn đã cố gắng xóa nhiều liên kết đến chất lượng thấp, lạc chủ đề hoặc spam khỏi trang web của mình, nếu bạn thấy mình bị mắc kẹt với một vài trình phân loại (điều này rất phổ biến), công cụ liên kết từ chối có thể là cách tốt nhất để bạn tránh bị phạt hiện tại hoặc trong tương lai.

Bạn cũng có thể muốn sử dụng công cụ này nếu bạn đang chuyển sang một bước ngoặt mới trong chiến lược SEO của mình. Bạn hoặc một nhà cung cấp trong quá khứ có thể đã cố ý tạo ra các backlink không tự nhiên trong quá khứ. Cho dù bạn đã bị phạt vì những backlink này hay  chưa , bạn vẫn mong muốn tuân theo các nguyên tắc của công cụ tìm kiếm. Sử dụng công cụ này giúp bạn đi trên con đường thực hành SEO tốt nhất.

Đây là những lý do rất quan trọng khác mà bạn có thể cần sử dụng công cụ liên kết từ chối.

Bạn biết rằng bạn cần tệp liên kết từ chối nếu bất kỳ điều nào sau đây là đúng:

  • Bạn nhận được thao tác thủ công hoặc  cảnh báo liên kết Google trong Search Console.
  • Bạn nghi ngờ một hình phạt liên kết thuật toán Penguin.
  • Bạn tin rằng bạn có thể là nạn nhân của SEO tiêu cực.

Hạn chế và hạn chế với các liên kết từ chối

Nếu bạn thuộc một hoặc nhiều loại được đề cập ở trên, công cụ liên kết từ chối có thể là lựa chọn tốt nhất cho bạn. Điều đó nói rằng, có những hạn chế và hạn chế đối với việc từ chối liên kết.

Sự cố với các công cụ liên kết từ chối:

  • Không biết liên kết hoặc miền của bạn bị người khác từ chối
  • Không có quyền kiểm soát thông tin chi tiết về hộp đen dữ liệu từ chối: Công cụ tìm kiếm lấy thông tin từ chối từ người dùng – danh sách các URL hoặc miền bạn muốn bỏ qua. Điều gì sẽ xảy ra nếu chúng ta có thể khai thác một số dữ liệu này?
  • Việc từ chối liên kết có thể phản tác dụng đối với người dùng. Các trang web có thể vô tình làm hỏng hồ sơ liên kết của họ trong quá trình làm sạch. Ramirez lưu ý rằng điều này thường xảy ra với các trang web có hình phạt thủ công. “Bạn buộc phải cắt bỏ các liên kết vẫn có giá trị trong nỗ lực xoa dịu Google. Cuối cùng thì bạn vẫn chưa được phát hành, nhưng kết quả là hồ sơ liên kết của bạn bị cạn kiệt nghiêm trọng. ” Vì lý do này, chúng tôi nhấn mạnh tầm quan trọng của việc sử dụng các công cụ từ chối công cụ tìm kiếm với sự trợ giúp của một chuyên gia và thậm chí cung cấp Dịch vụ Đánh giá Hình phạt SEO để giúp bạn.

Hãy tưởng tượng nếu bạn có thể thấy những backlink nào của bạn mà các trang web khác đã từ chối. Hãy tưởng tượng nếu bạn có thể xem liệu một trang web có từ chối trang web của bạn hay không. Thông tin như thế này sẽ cho phép cộng đồng SEO nói chung chống lại spam liên kết đến. Công cụ chúng tôi phát hành đã giải quyết những vấn đề này. 

Cách tạo tệp liên kết từ chối cho Google

Lưu ý của biên tập viên (5/2019) : Theo Google Help , công cụ liên kết từ chối hiện không được hỗ trợ trong Google Search Console mới. Tuy nhiên, nó vẫn có sẵn trong Search Console cũ. Sử dụng liên kết trực tiếp được cung cấp bên dưới.

Công cụ từ chối của Google yêu cầu bạn gửi danh sách các tên miền và trang mà bạn muốn Google bỏ qua khi đánh giá hồ sơ liên kết đến của bạn.

Bước đầu tiên để sử dụng công cụ liên kết từ chối của Google là tạo tệp .txt. Theo hướng dẫn của Google, loại tệp này phải là tệp a.txt được mã hóa bằng UTF-8 hoặc ASCII 7-bit. Trong tệp này, liệt kê các URL và miền bạn muốn từ chối; mỗi miền và URL phải có dòng riêng.

Để bao gồm liên kết cấp miền trong tệp, hãy thêm “miền:” trước URL của trang chủ miền (ví dụ: “miền: shadyseo.com”).

Để gửi liên kết cấp trang, chỉ cần liệt kê URL.

Thêm ghi chú cho mỗi lần gửi bằng cách bắt đầu thông báo bằng “#” trên dòng trước URL hoặc danh sách miền.

Ví dụ về tệp từ chối từ Trợ giúp của Google Search Console

Sau khi bạn có tệp .txt, bây giờ bạn có thể gửi danh sách cuối cùng đến công cụ Liên kết từ chối của Google. Đây là cách thực hiện:

  1. Đăng nhập vào Google Search Console.
  2. Truy cập https://www.google.com/webmasters/tools/disavow-links-main .
  3. Từ menu thả xuống, hãy chọn trang web mà bạn đang từ chối liên kết.
  4. Chọn “Từ chối liên kết”.
  5. Chọn “Chọn tệp”.
  6. Tải lên tệp .txt của bạn.

Hình ảnh công cụ liên kết từ chối GoogleThông báo gửi tệp từ chối Google thành công

Lưu ý: Nếu bạn muốn xóa liên kết khỏi hoặc thêm liên kết vào tệp từ chối của mình trong tương lai, hãy tải lên tệp mới và hoàn chỉnh. Tệp mới sẽ thay thế tệp trước đó.

Mẹo chuyên nghiệp: Từ chối cấp độ miền

Google cảnh báo người dùng về việc từ chối cấp miền vì thiệt hại tiềm ẩn mà nó có thể gây ra. Tuy nhiên, Ramirez nói điều gì đó hơi khác một chút. Từ chối các liên kết ở cấp độ miền là một cách tiếp cận triệt để hơn để làm sạch các liên kết xấu. Anh ấy nói rằng anh ấy sử dụng từ chối cấp miền thường xuyên vì “liên kết từ một trang blog cũng có thể được bao gồm trên thẻ hoặc trang chỉ mục danh mục và khi có nhiều bài đăng hơn được thêm vào thẻ / danh mục đó, liên kết được đẩy sâu hơn vào phân trang”. Một liên kết có thể là một mục tiêu di chuyển trong một trang web và cách duy nhất để trích xuất nó một cách an toàn là từ chối toàn bộ miền.

Công cụ liên kết từ chối của Bing

Cách sử dụng công cụ liên kết từ chối của Bing hơi khác so với công cụ của Google vì bạn không cần tải lên tệp .txt. Thay vào đó, bạn nhập từng tên miền hoặc URL theo cách thủ công.

  1. Đăng nhập vào Công cụ quản trị trang web Bing.
  2. Chuyển đến “Định cấu hình trang web của tôi” và sau đó chọn “Từ chối liên kết”.
  3. Trong công cụ Từ chối Liên kết, hãy sử dụng menu thả xuống để cho biết rằng bạn đang từ chối một trang, thư mục hoặc URL miền.
  4. Nhập URL bạn muốn từ chối và nhấp vào “Từ chối”.
  5. Bài nộp của bạn sẽ được làm nổi bật bên dưới công cụ cùng với ngày nó bị từ chối.
  6. Nếu bạn muốn xóa một bài gửi, hãy chọn hộp kiểm và nhấp vào nút “Xóa”.

Công cụ liên kết từ chối của Bing.Giao diện người dùng cho công cụ Disavow Links trong Bing Webmaster Tools

Cái gì tiếp theo?

Sau khi bạn đã gửi các liên kết mà bạn muốn Google và Bing bỏ qua, đã đến lúc chờ đợi. Google cho biết có thể mất vài tuần trước khi thu thập lại dữ liệu trang web của bạn và “xử lý lại các trang”. Điều này có thể đặc biệt khó chịu nếu bạn đang chờ khôi phục sau một hình phạt thủ công hoặc thuật toán nhất định. Bing nói rằng bạn có thể không nhận thấy bất kỳ thay đổi đáng kể nào! Ít nhất bạn có thể ngủ ngon hơn một chút khi biết rằng bạn đã dọn dẹp sạch sẽ ngôi nhà của các backlink chất lượng thấp – cho đến khi, tất nhiên, đã đến lúc làm lại.

VIDEO THƯỞNG HƯỚNG DẪN SEO

Hãy nghe Matt Cutts, cựu trưởng nhóm chống lại web spam của Google, giải thích lý do ra đời của công cụ Disavow Backlinks và khi nào nên sử dụng nó. (Độ dài là 9:19)

Anh ấy đã ghi lại điều này khi Google giới thiệu công cụ này vào tháng 10 năm 2012. Anh ấy cảnh báo mọi người không nên sử dụng công cụ này trừ khi họ nhận được thông báo lỗi liên kết từ Google; tuy nhiên, hầu hết các trang web ngày nay có một số liên kết xấu mà họ cần phải cắt bỏ và có thể cần sử dụng công cụ này. 

Sơ đồ trang web là gì? Cách tại sitemap chuẩn nhất

Tạo sơ đồ trang cho trang web của bạn và cập nhật nó là những phương pháp hay nhất về SEO. Các công cụ tìm kiếm có thể thu thập thông tin và lập chỉ mục trang web của bạn hoàn chỉnh hơn nếu bạn tạo một sơ đồ trang web để tham khảo.

Bài học SEO cần thiết này bao gồm cách tạo sơ đồ trang web để bạn có thể chào đón các trình thu thập thông tin công cụ tìm kiếm và giúp họ tìm đường khi họ truy cập.

Sơ đồ trang web là gì?

Có hai loại Sơ đồ trang web: HTML và XML và chúng phục vụ các mục đích SEO rất khác nhau. Sơ đồ trang XML là một tệp văn bản mà quản trị viên web tạo ra để thông báo cho các công cụ tìm kiếm như Google và Bing về các trang, hình ảnh và video trên trang web của bạn. Sơ đồ trang web HTML phục vụ khách truy cập trang web và xác định các phần quan trọng của trang web của bạn.

XML: Về cơ bản, đó là danh sách tất cả các URL (địa chỉ trang) mà bạn muốn lập chỉ mục cho trang web của mình – URL của các trang web, hình ảnh, video và các tệp nội dung khác trên trang web – được định dạng bằng một vài thẻ XML.

HTML: Đây là một trang web thân thiện với khách truy cập và giúp họ xác định các phần chính của trang web của bạn. Đây là một trang web được thu thập thông tin bởi các trình thu thập thông tin của công cụ tìm kiếm. Người ta tin rằng một trang trong sơ đồ trang HTML là một trang rất quan trọng và nó có thể ảnh hưởng đến thứ hạng kết quả tìm kiếm.

Tìm hiểu cách tạo sơ đồ trang web cho trang web của bạn. Tạo sơ đồ trang HTML và XML là cách tốt nhất để thông báo cho các công cụ tìm kiếm về các trang web của bạn để lập chỉ mục.

Sơ đồ trang web XML so với HTML

Sơ đồ trang web XML không nên nhầm lẫn với các sơ đồ trang web HTML , là các trang web thông thường được tạo ra để giúp con người truy cập vào trang web. Mỗi loại đều có lợi ích về SEO, vì vậy bạn nên tạo cả hai loại XML và HTML cho trang web của mình . Đây là những điểm khác biệt:

 Sơ đồ trang web XMLSơ đồ trang web HTML
Công cụ tìm kiếm có thể thu thập thông tinĐúngĐúng
Được đọc bởi những người truy cậpKhôngĐúng
Kích thước tối đa50.000 URL hoặc 10MB không nénKhông xác định, nhưng giữ cho nó thân thiện với người dùng
định dạngTệp XML (văn bản thuần túy)Trang web (có thể khá)
Được liên kết từTệp Robots.txtĐiều hướng trang web (chân trang)
Có thể được gửi thủ công cho các công cụ tìm kiếmĐúngCó, như một URL thông thường
Được đề xuất cho SEOĐúngĐúng

Tôi nên tạo bao nhiêu sơ đồ trang web?

Mỗi trang web cần ít nhất một sơ đồ trang XML.  Có một sitemap XML up-to-date thực sự là một điều cần thiết thực hành tốt nhất SEO. Tương tự như vậy, cách tốt nhất là có một sơ đồ trang web HTML cho người dùng của bạn.

(Ngược lại, việc gửi trang web của bạn theo cách thủ công là một nhiệm vụ tùy chọn. Bạn chỉ cần thực hiện một lần gửi, chẳng hạn như khi bạn khởi chạy một trang web mới, thêm một phần trang web mới hoặc thay đổi nội dung và không muốn đợi trình thu thập thông tin để tìm nó.)

Các trang web lớn có thể cần phải chia danh sách URL của chúng thành nhiều sơ đồ trang XML. Điều này đảm bảo rằng số lượng URL trang trên mỗi sơ đồ trang web không vượt quá giới hạn. Mặc dù một sơ đồ trang XML có thể chứa tới 50.000 URL trang, chúng tôi khuyên bạn không nên nhiều hơn 2.000 cho mỗi tệp XML để cải thiện mức độ phù hợp của SEO.

Chúng tôi cũng khuyến nghị (đối với bất kỳ trang web có kích thước nào) nên liệt kê một số loại tệp nhất định trong sơ đồ trang web chuyên dụng của riêng chúng: videotin tức là hai ví dụ. Do đó, nếu bạn có video trên trang web của mình, hãy tạo sơ đồ trang web XML video chuyên biệt để giúp đảm bảo các công cụ tìm kiếm tìm thấy tệp video của bạn.

VIDEO THƯỞNG HƯỚNG DẪN SEO

Trong một video hữu ích khác từ Trợ giúp quản trị trang web của Google, Matt Cutts trả lời tại sao việc cung cấp một sơ đồ trang HTML VÀ một Sơ đồ trang XML lại quan trọng .

Hãy lắng nghe khi anh ấy giải thích rằng vì chúng đáp ứng các nhu cầu khác nhau nên cả hai đều quan trọng, đặc biệt là đối với việc thu thập thông tin của công cụ tìm kiếm.

Cách tạo Sơ đồ trang web XML

Bạn có thể tạo sơ đồ trang web theo cách thủ công, nhưng sử dụng trình tạo sơ đồ trang web sẽ giúp công việc dễ dàng hơn. Có rất nhiều công cụ của bên thứ ba tốt để tự động tạo sơ đồ trang XML. Một là Plugin Sơ đồ trang web Bing XML phía máy chủ miễn phí của Microsoft Bing , có thể tự động tạo ra hai loại sơ đồ trang XML có thể được đọc bởi bất kỳ công cụ tìm kiếm nào:

  • Sơ đồ trang web toàn diện , bao gồm tất cả các tệp (ngoại trừ bất kỳ tệp nào bạn không cho phép trong tệp robots.txt của mình)
  • Sơ đồ trang web được cập nhật gần đây , chỉ bao gồm URL của các tệp đã thay đổi (hữu ích cho việc theo dõi của riêng bạn hoặc để ưu tiên các trang mà công cụ tìm kiếm nên thu thập thông tin)

LƯU Ý: Bất kỳ công cụ tìm kiếm nào cũng có thể đọc các tệp sơ đồ trang XML của bạn vì chúng tuân thủ giao thức Sitemaps.org.

Cách tạo Sơ đồ trang web HTML

Nói một cách đơn giản, đây là một trang trên trang web của bạn, theo quy ước thường được liên kết đến ở chân trang (đôi khi là đầu trang) sẽ giúp người dùng đang gặp khó khăn trong việc xác định những gì họ muốn trên trang web của bạn. Trong các trường hợp bình thường, đó là một danh sách giới hạn các liên kết đến các khu vực chính trên trang web của bạn. Nếu bạn có một tìm kiếm trang web, bạn nên chắc chắn bao gồm nó vì thường người dùng của trang này bị mất. Đơn giản chỉ cần tạo một trang gồm các liên kết chính và liên kết đến nó từ mọi mẫu trang trong chân trang.

Vì sơ đồ trang web HTML được tham chiếu qua các liên kết từ các trang trên trang web của bạn nên SEO không cần phải gửi nó một cách riêng biệt – các công cụ tìm kiếm có thể dễ dàng tìm thấy và thu gọn nó.

Cách gửi Sơ đồ trang web XML của bạn tới Công cụ Tìm kiếm

Bạn có thể gửi (các) sơ đồ trang XML của mình cho Google và Bing bằng cách sử dụng tính năng Sơ đồ trang web trong các công cụ quản trị trang web của họ:

  • Google: Đăng nhập vào tài khoản Google Search Console của bạn. Trong menu Thu thập thông tin, hãy chọn Sơ đồ trang web.
  • Bing: Đăng nhập vào Bing Webmaster Tools. Bạn có thể sử dụng tiện ích Sơ đồ trang web trên Trang tổng quan của mình hoặc đi tới tính năng Sơ đồ trang web, nằm trong phần Định cấu hình trang web của tôi.

Các phương pháp trên cho phép bạn chủ động gửi (các) tệp sơ đồ trang XML của mình tới các công cụ tìm kiếm nếu bạn muốn. Dù vậy, hãy đảm bảo rằng bạn chỉ định vị trí của sơ đồ trang XML trong tệp robots.txt của mình , nơi các trình thu thập thông tin chắc chắn sẽ tìm thấy nó sau đó vào lần thu thập thông tin tiếp theo. (   Tệp robots.txt chỉ đơn giản là một tệp văn bản được lưu tại thư mục gốc của trang web của bạn để cung cấp hướng dẫn cách truy cập các trình thu thập thông tin của công cụ tìm kiếm.) Tệp robots.txt của bạn sẽ trông giống như thế này, với dòng chỉ thị Sơ đồ trang web cho mỗi XML khác nhau của bạn sơ đồ trang web:

Đại lý người dùng: *

Disallow: / tmp /

Disallow: /filename.html

Sơ đồ trang web: http://website.com/my-sitemap1.xml

Sơ đồ trang web: http://website.com/my-sitemap2.xml

Đó là nó! Khi bạn tạo sơ đồ trang XML của mình và cho các công cụ tìm kiếm biết nơi tìm chúng bằng cách sử dụng tệp robots.txt của bạn, trình thu thập thông tin của công cụ tìm kiếm sẽ thực hiện phần còn lại. Nếu bạn cần thêm chi tiết về cách tạo Sơ đồ trang web, hãy xem Trợ giúp Search Console của Google .