Cách xử lý những dạng trùng lặp nội dung SEO phổ biến nhất

Trùng lặp nội dung (Duplicate Content) là một trong những lỗi SEO cần nên tránh. Bởi vì việc nội dung trùng nhau, xuất hiện ở nhiều địa chỉ URL sẽ gây ra ảnh hưởng lớn trên bảng xếp hạng tìm kiếm. Dĩ nhiên điều này cũng khiến cho lực đẩy SEO của trang web bị ảnh hướng. Khi phải chia đều lượt hiển thị nội dung cho các URL. Từ đó Google Bot sẽ không biết được phải xếp hạng phiên bản nào cho kết quả tìm kiếm. Chính vì vậy nếu muốn SEO content đạt được hiệu quả cao. Bất cứ ai khi làm SEO cũng đừng mắc phải những lỗi sau.

Trùng lặp nội dung SEO giữa www và non wwww

Dạng này khá phổ biến và nhiều người cũng đã biết tới. Nếu trang của bạn mắc lỗi này thì có bao nhiêu index trang sẽ có bấy nhiêu lỗi. Vì do lỗi tác động tới toàn trang. Để xử lý vấn đề này, bạn có thể sử dụng tới điều hướng 301 hoặc sử dụng WMT để quy định tên miền ưu thích. Ngày nay, nó được coi là một cách thực hành tốt nhất để sử dụng các liên kết chính tắc. Điều này là do nội dung trùng lặp có thể xuất hiện ở nhiều dạng khác nhau mà không bao gồm www và không www. Blog đặc biệt sẽ hoạt động với các trang có thể truy cập thông qua nhiều URL khác nhau, ví dụ:

/date/

/tag/

/author/

Sử dụng các liên kết Canonical một cách chính xác sẽ đảm bảo rằng nội dung của bạn tuy nhiên có thể được truy cập không bao giờ được đánh dấu là trùng lặp.

Trùng lặp www và non wwww khá phổ biến
Trùng lặp www và non wwww khá phổ biến

Trùng lặp trang chủ có link đích mặc định

Dễ gặp với các trang có link đích mặc định là website.com/home; website.com/index.php, website.com/index.aspx… Trong khi nó vẫn nhận mặc định là website.com. Trường hợp này xử lý tương tự với trường hợp 1 hoặc có thể sử dụng canonical để về link chính.

Trùng lặp nội dung SEO trang do cho phép in bài viết

Với những trang cho phép in bài viết mà không để ý xử lý thì Google sẽ rất dễ index cả trang in. Điều dễ hình dung ở đây là trang in có nội dung chẳng khác gì với bài viết chi tiết. Với lỗi này bạn có thể dùng thẻ canonical quy định link chính, dùng thẻ robots hoặc file robots.txt để chặn index lại.

Trùng lặp nội dung SEO do điều kiện lọc

Dạng này thường xảy ra với các trang bán hàng nhiều hơn. Khi trong danh mục thường có các điều kiện lọc kiểu như: giá thấp tới cao, giá cao tới thấp; freeship, lọc theo thuộc tính sản phẩm…. Chưa kể lọc kết hợp các điều kiện nhưng thứ tự các điều kiện đảo nhau. Nếu bộ code của bạn sinh ra các link khác nhau với các điều kiện lọc khác nhau? Xảy ra lỗi trùng lặp đó. Vậy xử lý sao?

Trùng lặp nội dung SEO do điều kiện lọc
Trùng lặp nội dung SEO do điều kiện lọc

Xử lý ở trường hợp này có khá đa dạng. Ví dụ lọc theo thuộc tính thì hoàn toàn có thể tạo các danh mục con để có những landing page chuẩn seo hơn. Tất nhiên với điều kiện sản phẩm của bạn đủ đa dạng. Ngoài ra bạn cần tối ưu lại chúng sau khi chia nhỏ danh mục.

Nhưng nếu sản phẩm của bạn không đa dạng đủ để chia danh mục hoặc bạn chẳng thể tối ưu được thì sao? Chưa hết đường nhưng bạn có thể chặn index chúng lại qua WMT với việc chặn tham số lọc (khi bạn là SEOer không quá dành về code). Nếu bạn chủ động về kỹ thuật thì có thể làm thẻ canonical về link chính; hoặc chặn index với thẻ robot.

Trùng lặp nội dung SEO do phân trang tin tức và sản phẩm

Dạng này tuy rất nhiều người biết đến tuy nhiên chẳng ít người mắc phải. Việc phân trang tin tức và sản phẩm nếu không được xử lý thì các bạn sẽ thấy báo lỗi trong WMT luôn thông qua mục cải tiến HTML phần trùng lặp title và description. Với dạng này google khuyến khích chúng ta nên sử dụng các thẻ rel=”next” và rel=”prev”.

Trùng lặp nội dung do phân trang tin tức và sản phẩm
Trùng lặp nội dung do phân trang tin tức và sản phẩm

Trùng lặp không hoàn toàn chủ yếu do cơ chế tag tự do

Thường xảy ra với các trang áp dụng cơ chế tag tự do hoặc có 1 cấu trúc danh mục không dõ dàng. Đây là dạng thường gặp với các trang wordpress không có cơ chế quản lý tag và danh mục rõ ràng. Bạn đã có 1 danh mục là “sản phẩm loại A” mà bạn lại có tag là “Sản phẩm loại A”. Hoặc cụ thể hơn Danh mục “đồ dùng cho bé” và Tag “đồ dùng cho em bé” vậy thì sẽ có chuyện gì. Hiểu nôm na là sản phẩm loại A của bạn đang tồn tại 2 trang cùng nói về nó. Nó không hẳn là nội dung duplicate 100% nhưng nó là dạng nội dung tương tự. Vậy cũng sẽ ảnh hưởng trực tiếp tới chất lượng website của bạn.

Bạn cần định hình cấu trúc cây thư mục cho website của bạn. Ngoài ra cần có cơ chế quản lý từ khóa chặt chẽ. Điều này sẽ giúp tránh việc trùng lặp do việc đánh tag bất hợp lý nội dung.

Bất cứ ai khi làm SEO cũng đều chú trọng vào nội dung, làm sao để người đọc có thể tiếp nhận chủ đề nhanh nhất, cách viết làm sao dễ hiểu nhất. Đặc biệt, nội dung SEO hấp dẫn sẽ càng khiến bài viết trên website của bạn được đánh giá cao. Tuy nhiên việc trùng lặp nội dung (duplicate content) là điều không tránh khỏi. Nếu xét về yếu tố bên trong, thì lỗi này là do hệ thống source gây ra. Vậy nội dung của bạn đang ở dạng trùng lặp nào, và cách xử lý chúng ra sao? Hi vọng bài viết này giúp bạn có thêm thông tin cần thiết về các dạng trùng nội dung.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

error: Xin đừng copy em :)