Khám phá thuật toán Google Panda trong SEO

Khám phá thuật toán Google Panda trong SEO

Google Panda là một bộ lọc nội dung nhằm mục đích để cải tiến kết quả tìm kiếm của Google. Đây được coi là thuật toán thay thế cho thuật toán Google Cafein, mục tiêu chính của Google Panda là loại bỏ những kết quả tìm kiếm  có chưa nội dung spam, sao chép, những website chất lượng thấp.

Vậy Thuật toán Google Panda là gì?

Google Panda là một thuật toán được ra mắt vào ngày 24 tháng 2 năm 2011. Google Panda được sinh ra giúp thay đổi cách xếp hạng  trên SERR (kết quả tìm kiếm) công bằng và tốt hơn và được trả về những kết quả chính xác và phù hợp nhất.

Mục đích chính của Google Panda được tạo ra để:

  • Làm giảm đi sự hiện diện của các trang web chất lượng thấp trong kết quả Organic Search của Google
  • Thưởng cho các trang web có chất lượng cao, thu hút người đọc
  • Xem xét chất lượng nội dung website, nhằm loại bỏ những phần có nội dung sai phạm, nội dung rác hoặc được copy từ những trang website khác.

Nếu website của bạn bị rớt hạng  trong quá trình thuật toán Google Panda đang cập nhật, điều này lập đi lập lại  nhiều lần trong thời gian dài thì rất có thể là nội dung website. Và điều này không  đủ sức thuyết phục Google, trên thực tế thì  website  đang tăng trưởng tốt vẫn có nhiều khả năng bị Google Panda phạt.

Những nguyên nhân website bị dính phạt bởi Google Panda

Top 7 nguyên nhân chính do Onpage

1. Nội dung mỏng, trùng lập, ít thông tin (Thin Content): Thin content (nội dung mỏng) bạn có thể hiểu theo cả nghĩa đen và nghĩa bóng: Chất lượng Content thấp và Content ngắn có thể liệt kê các lỗi như:

  • Content không cung cấp đúng giá trị hữu ích cho người đọc
  • Nội dung copy từ trang web khác
  • Topic mỗi bài viết không liên quan đến lĩnh vực chính cũng như dịch vụ của website, không đồng nhất về nội dung cũng như chủ đề

2. Nội dung có chất lượng thấp

Các website cung cấp ít nội dung chất lượng và giá trị cho người đọc vì thiếu thông tin chuyên sâu, bên cạnh đó họ cũng chưa có đội ngũ SEO và Content chuyên nghiệp cho việc này

Điểm nhận biết các website trên:

  • Viết bài thiếu ý
  • Truyền tải qua loa, vắn tắt nhanh gọn
  • Không phân tích chủ đề, nội dung chuyên sau
  • Ít tìm tòi để mở rộng chủ đề
  • Trình bày thiếu ý, sai chính tả, dấu câu…

3. Content farming

Content farming là một trong những thuật ngữ có hàm ý để chỉ các website spam nội dung, hay thu thập và copy content của website khác về cho website mình. Sau đó nhồi nhét các từ khóa vào và tối ưu SEO tốt hơn nhiều so với website ban đầu.

Nhiều website sử dụng Content farming họ đều hướng đến việc tăng thứ hạng cho website trên thanh công cụ tìm kiếm nhiều hơn là tập trung vào giá trị nội dung cho người đọc

4. Website thiếu Authority/ và không có độ tin tưởng cao

Content được tạo ra từ các nguồn không được xác minh vè Entity, thiếu thẩm quyền (Authority) và thiếu độ tin cậy (trust) cho người đọc. Điều đó  sẽ dễ dẫn đến website của bạn bị thuật toán Google Panda loại bỏ ngay.

5. Trùng lập nội dung (Duplicate content)

Đa phần nội dung copy thường xuất hiện nhiều trên Internet. Vì đơn giản bạn không biết phải ghi gì, miêu tả như thế nào cho hợp lí với website của mình. Từ đó bạn sẽ tham khảo nhiều từ nguồn trang website khác nhau buộc bạn phải sap chép nội dung đó

Duplicate content cũng có thể xảy ra trên chính website của bạn khi có nhiều trang chứa trùng 1 nội dung, hoặc có rất ích sự thay đổi nội dung giữa các trang.

Google tính trùng lập nội dung qua:

  • Thẻ meta description
  • Nội dung từng trang
  • Thẻ HTML
  • Thẻ heading
  • Giao diện web
  • Khung design mặc định của website

6. Lỗi Schema

Google đã đưa quy luật đối với Schema:  Nếu bạn khai gì trên schema thì người dùng phải thấy y chang như vậy trên website của bạn.

Nếu những thông tin này bạn đưa sai lệch hoặc làm trái quy luật của Google; đến lúc đó Google sẽ can thiệp vào và thu thập đủ dữ liệu về bạn và nó tiến hành phạt website của bạn.

7. Website chứa nhiều nội dung quảng cáo

Hiện nay trên website chủ yếu là đặt banner để quảng cáo với rất ít nội dung thực sự cung cấp đủ thông tin giá trị cho người đọc. Hầu hết các website này tạo ra để kiếm tiền từ việc đặt banner quảng cáo, ít nội dung, kiến thức.

Top 2 nguyên nhân chính do Offpage

8. Keyword Cannibalization

Keyword Cannibalization là từ khóa cạnh tranh lẫn nhau, cho dù bạn chủ động hay vô tình tạo nhiều nội dung, bài viết  cùng nói đến 1 chủ đềhay cùng tối ưu một số từ khóa cụ thể

Sẽ dẫn đến các URL này dù vẫn được hiển thị trên thanh cọng cụ tìm kiếm Google, nhưng cuối cùng thì kết quả thì sẽ không có trang nào lên được vị trí top 10. Khi đó Google sẽ vào xem xét website, nó sẽ ưu tiên quan sát những trang được tối ưu duy nhất.

9. Trộn nội dung (Spin content)

Spin content: Trộn nội dung lại với nhau để thành 1 bài viết mới

Một bài viết mới có thể cùng ý nghĩa với bài viết gốc nhưng cũng có thể khác về mặt câu chữ hoặc cũng có thể là  mang ý nghĩa khác hoàn toàn so bài viết gốc.

Tuy nhiên với hình thức Spin content tạo ra những nội dung này đã được Google xem như là nội dung rác.

Google liên tục cập nhật những thuật toán mới nhằm loại bỏ những nội dung rác như vậy đặc biệt là dùng thuật toán Google Panda.

2 công cụ hỗ trợ sửa phạt thuật toán Google Panda

Trong quá trình các bạn làm SEO, để tránh được các hình phạt của Google đặc biệt nhất là vấn đề Copy bài viết bạn có thể nhờ đến sự hỗ trợ của nhiều công cụ kiểm tra như:

Siteliner: Với công cụ siteliner có chức năng tìm nội dung  copy dựa trên bản gốc domain của bạn (Duplicate content on your site). Công cụ này sẽ báo chỉ số phần trăn giống bao nhiêu giữa các bài

Copy scape: Copy scape nó giúp bạn theo dõi nội dung mà bạn copy từ những trang web khác hoặc hoặc những nội dung nào trên trang bạn đang bị trang khác copy. Chú ý đến cột RISK, nếu bài viết nào có màu càn g đậm thì chứng tỏ bài viết ấy được copy nhiều nhất, Copy scape là 1 công cụ có trả phí.

Thuật toán Panda có thể xử phạt bạn trên tất cả website dù là bạn đang phát triển trên cả mặt Offpage và Online, hầu như các website ở Việt Nam đều có khả năng cao bị Google Panda để ý và sẽ ảnh hưởng đến toàn bộ domain.

Mình hy vọng với bài viết này sẽ giúp các bạn hiểu rõ hơn về thuật toán Google Panda, và những nguyên nhân bị dính phạt từ Google từ công cụ này. Qua đó có thể cho bạn 1 cái nhìn chi tiết hơn và tổng quan hơn, mình mong bài viết này có thể giúp được nhiều cho các bạn.