NHỮNG DẠNG TRÙNG LẶP NỘI DUNG CÓ THỂ BẠN CHƯA BIẾT

Như các bạn đã biết thì hiện nay “content is king”. Mọi người làm seo luôn chú ý tới việc làm nội dung sao cho unique, chất lượng. Để tạo ra những nội dung không bị trùng lặp thì trong giới seo hiện nay vẫn thường dùng 2 cách là tự sáng tạo content hoặc lấy lại bài viết của 1 đơn vị khác và chỉnh sửa lại (có thể là dịch). Tuy nhiên, liệu đã áp dụng 2 phương pháp trên bạn đã chắc chắn là mình không bị trùng lặp nội dung?

Trùng lặp nội dung

Trùng lặp nội dung.

​Các bài liên quan:

Câu trả lời là không. Ở đây tôi không nói tới các yếu tố bên ngoài dạng như là có đối thử lấy bài mình post đi đâu đó mà tôi chỉ xem xét trên chính bản thân website của bạn. Đôi khi chúng ta bị duplicate content mà chúng ta không hề biết. Những dạng lỗi này thường do hệ thống source của chúng ta gây ra. Cùng xem xét các trường hợp xem bạn có đang mắc phải không nhé.

1. Dạng trùng lặp www và non www

Dạng trùng lặp non www và www

Trùng lặp dạng www và non www.

  • Dạng này khá phổ biến và nhiều người cũng đã biết tới. Tuy nhiên tôi không thể không đề cập tới vì đây được coi là lỗi khá lớn. Nếu trang bạn đang dính lỗi này rồi thì bạn cứ tưởng tượng bạn có bao nhiêu index trang thì đã có bấy nhiêu lỗi rồi đó vì nó tác động tới toàn trang mà.
  • Để xử lý vấn đề này bạn có thể sử dụng tới điều hướng 301 hoặc sử dụng WMT để quy định tên miền ưu thích. Xong! Như vậy đã giải quyết được 1 trường hợp

2. Dạng trùng lặp trang chủ.

Dạng trùng lặp trang chủ

Trùng lặp trang chủ.

  • Dễ gặp với các trang có link đích mặc định là website.com/home, website.com/index.php, website.com/index.aspx … trong khi nó vẫn nhận mặc định là website.com.
  • Trường hợp này xử lý tương tự với trường hợp 1 hoặc có thể sử dụng canonical trỏ về link chính.

3. Dạng trùng lặp trang in.

Dạng trùng lặp trang in

Dạng trùng lặp trang in.

  • Cái này bản thân mình đã trải nghiệm khi nhận dự án tin tức trước đây. Với những trang cho phép in bài viết mà không để ý xử lý thì google sẽ rất dễ index cả trang in. Điều dễ hình dung ở đây là trang in có nội dung chẳng khác gì với bài viết chi tiết cả. Nội dung trùng lặp rõ ràng quá rồi việc cần bây giờ là xử lý thôi.
  • Với lỗi này bạn có thể dùng thẻ canonical quy định link chính, dùng thẻ robots hoặc file robots.txt để chặn index lại.

4. Dạng trùng lặp do các điều kiện lọc.

Dạng trùng lặp do các điều kiện lọc

Dạng trùng lặp do các điều kiện lọc.

  • Dạng này thường xảy ra với các trang bán hàng nhiều hơn. Khi trong danh mục thường có các điều kiện lọc kiểu như: Giá thấp tới cao, giá cao tới thấp, freeship, lọc theo thuộc tính sản phẩm…. Chưa kể lọc kết hợp các điều kiện nhưng thứ tự các điều kiện đảo nhau. Nếu bộ code của bạn sinh ra các link khác nhau với các điều kiện lọc khác nhau? Lỗi trùng lặp đó. Vậy xử lý sao.
  • Về xử lý ở trường hợp này mình thấy có khá đa dạng cách xử lý. Ví dụ với lọc theo thuộc tính thì hoàn toàn có thể tạo các danh mục con để có những landingpage chuẩn seo hơn. Tất nhiên với điều kiện sản phẩm của bạn đủ đa dạng và bạn cần tối ưu lại chúng sau khi chi nhỏ danh mục. Nếu mọi chuyện như trên cả thì dễ rồi nhưng nếu sản phẩm của bạn không đa dạng đủ để chia danh mục hoặc bạn chẳng thể tối ưu được thì sao? Chưa hết đường nhưng bạn có thể chặn index chúng lại qua WMT với việc chặn tham số lọc (khi bạn là SEOer không quá dành về code). Nếu bạn chủ động về kỹ thuật thì có thể làm thẻ canonical về link chính hoặc chặn index với thẻ robot thôi.

 5. Dạng trùng lặp nội dung do phân trang

Trùng lặp trang nội dung

Trùng lặp trang nội dung

  • Dạng này tuy rất nhiều người biết đến tuy nhiên chẳng ít người mắc phải. Việc phân trang tin tức và sản phẩm nếu không được xử lý thì các bạn sẽ thấy báo lỗi trong WMT luôn thông qua mục cải tiến HTML phần trùng lặp title và description.
  • Với dạng này google khuyến khích chúng ta nên sử dụng các thẻ rel=”next” và rel=”prev”.

6. Dạng trùng lặp không hoàn toàn.

trùng lặp nội dung do tag

Trùng lặp nội dung do tag.

  • Thường xảy ra với các trang áp dụng cơ chế tag tự do hoặc có 1 cấu trúc danh mục không dõ dàng. Đây là dạng thường gặp với các trang wordpress không có cơ chế quản lý tag và danh mục rõ ràng. Bạn đã có 1 danh mục là “sản phẩm loại A” mà bạn lại có tag là “Sản phẩm loại A” hoặc cụ thể hơn Danh mục “đồ dùng cho bé” và Tag “đồ dùng cho em bé” vậy thì sẽ có chuyện gì. Hiểu nôm la là sản phẩm loại A của bạn đang tồn tại 2 trang cùng nói về nó. Nó không hẳn là nội dung duplicate 100% nhưng nó là dạng nội dung tương tự vậy cũng sẽ ảnh hưởng trực tiếp tới chất lượng website của bạn.
  • Hướng xử lý: Đây là việc làm cần hệ thống từ đầu. Bạn cần định hình cấu trúc câu thư mục cho website của bạn và cần có cơ chế quản lý từ khóa chặt chẽ tránh việc trùng lặp do việc đánh tag bất hợp lý nhân viên nội dung.

Đây là nhưng dạng mà mình đã từng gặp phải và cũng là hướng xử lý mình đã áp dụng. Không dám chắc cách xử lý của mình là chuẩn mực xong nó cũng đã giúp mình tối ưu lại các dự án gặp phải. Cám ơn đã đọc bài và hy vọng nhận được góp ý từ các bạn.