Nội dung trùng lặp có thể là một kẻ giết người thầm lặng đối với website, đặc biệt đối với các blog và các trang web về tin tức nếu không được xử lý chính xác và đúng cách. Thông thường blog và website tin tức sử dụng theme wordpress thì sử dụng categories để phân chia trang. Và nếu không được làm chặt chẽ sẽ có thể dẫn tới trùng lặp nội dung đối với các công cụ tìm kiếm đặc biệt là google.

Trùng lặp nội dung

Vậy làm thế nào để chúng ta có thể điều khiển được nội dung nào thì cho phép các công cụ tìm kiếm index và xếp hạng?

​Các bài liên quan:

Trong bài này Seo nguyễn sẽ giới thiệu với bạn (hoặc nhắc nhở bạn, nếu bạn đã biết về chúng) về 1 vài thẻ meta, được đặt trong <head> của trang web của bạn, có thể sẽ giúp bạn đối phó với nội dung trùng lặp. Cuối cùng, nếu bạn đang sử dụng WordPress, tôi sẽ cho bạn thấy làm thế nào để làm điều đó bằng cách sử dụng Yoast’s plugin.

Các Meta Tags quan trọng trong seo:

Các thẻ dưới đây rất quan trong để có thể giảm được tình trạng trùng lặp nội dung xảy ra trên site của bạn mà bạn không để ý:

1. Rel = "next" và Rel = "prev"

  • Rel = "next" và rel = "prev" đã được giới thiệu bởi Google trong tháng 9 năm 2011 như một cách để SEOER để chỉ là một trang được chứa trong một hệ thống phân cấp của các trang. Bởi vì Google bot ghét index một trang đánh số vì chúng thường không cung cấp trải nghiệm người dùng tốt nhất, thẻ này có thể được sử dụng để hiển thị các hệ thống phân cấp cho Google.

Làm thế nào để thực hiện rel = "next" và rel = "prev"

  • Bạn sẽ thực hiện các thẻ trong các cách sau:

Trên http://www.domain.com/category/, đặt sau vào phần <head>:

<Link rel = "next" href = "http://www.domain.com/category/page2" />

Trên http://www.domain.com/category/page2, trang thứ hai trong series, đặt sau đây:

<Link rel = "next" href = "http://www.domain.com/category/page3" />

<Link rel = "prev" href = "http://www.domain.com/category/" />

Cuối cùng, vào http://www.domain.com/category/page3/, đặt sau đây:

<Link rel = "prev" href = "http://www.domain.com/category/page2/" />

Chú ý: Đầu tiên thì chỉ nên sử dụng duy nhất thẻ rel="next", và đoạn cuối cùng chỉ nên sử dụng duy nhất thẻ rel="prev".

2. Meta Robots:

Thẻ meta robot

Meta robots.

  • Tiếp theo là thẻ meta = "robots". Mục đích của bài này không phải là để dạy cho bạn làm thế nào để sử dụng các thẻ meta robot trong tất cả các hoàn cảnh khác nhau, vì vậy tôi sẽ chỉ giới thiệu cho bạn các hướng dẫn chính thức của trang Robotstxt.org. Đối với mục đích đối phó với việc nội dung trùng lặp trên kết quả phân trang, bạn cần thêm:

<Meta name = "robots" content = "noindex, follow" />

  • Việc sử dụng thẻ này sẽ ngăn chặn được bot index page này của bạn và từ đó sẽ không hiển thị trên SERP và không dẫn tới trùng lặp nội dung.

3. Rel = Canonical

  • Thẻ cuối cùng bạn cần biết về là thẻ rel = canonical ,thẻ này thì khá quen thuộc đối với các bạn làm seo rồi. Tuy nhiên thì vẫn lưu ý các bạn rằng thẻ canonical không phải là redirect 301, và nó được dùng để xử lý tình trạng trùng lặp website do bạn tạo khá nhiều "bản sao" trên site (2,3 bài giống hệt nhau nhưng url khác nhau). Ví dụ 1 vài trường hợp dưới đây

Thẻ canonical trong seo

Lý do trùng lặp do url tự động thêm phần ?color=blue hoặc gì đó tương tự.

Thẻ canonical trong seo 2

Lý do trùng lặp do trong url có thêm yếu tố chèn vào url khiến các url khác nhau.

Thẻ canonical trong seo

Trùng lặp do thêm ID.

  • Thẻ canonical sẽ giúp cho robot nhận ra rằng web không cho phép thực hiện các liên kết ở trang sâu hơn so với quy định => Giảm trùng lặp.

Cấu trúc thẻ rel="Canonical":

<link rel="canonical" href="http://domain.com" />

  • Trên đây là 3 lý do có thể dẫn tới trùng lặp nội dung website và làm cho website không được index. Cách khắc phục mình đã nêu ra hy vọng có thể giúp ích nào đó cho các bạn