(seo.edu.vn) - Các trang web scraper đó là những trang web mà sao chép nội dung từ những trang khác và đăng nó trên trang web của mình hoặc blog như là của riêng của mình nó đã trở thành một hiện tượng thường xuyên sảy ra nhiều năm nay.

Mặc dù theo một cách hợp lý nào đó, nội dung có nguồn gốc nên xếp hạng cao hơn nội dung copy vì chúng là nguồn khởi đầu, nhưng thường các bạn sẽ tìm thấy các trang web scraper xếp hạng trên những trang gốc bởi vì chúng thường kết hợp với các phương pháp, thủ thuật SEO khác để có được xếp hạng nội dung cao hơn.

web scraper

 

web scraper

Thậm chí tệ hơn , đôi khi là nội dung gốc biến mất khỏi kết quả tìm kiếm trong khi phiên bản một trang web scraper vẫn tiếp tục để xếp hạng tốt

Google hôm nay đã phát hành một hình thức Scraper Báo cáo mới nơi quản trị web có thể gửi các trang web scraper đã sao chép nội dung của họ bằng cách cung cấp cho Google với URL nguồn, nơi mà nội dung được lấy từ và URL của trang web scraper nơi mà nội dung đang được tái bản hoặc thêm thắt và các từ khóa mà trang web scraper được xếp hạng trên .

Google cũng đang yêu cầu các quản trị web để xác nhận rằng trang web của họ theo hướng dẫn quản trị trang web trước khi trình lên , mặc dù rất có thể là khá tốt mà những người quản trị web tìm thấy mẫu báo cáo scraper cũng nhận thức được các nguyên tắc quản trị trang web của Google và làm thế nào để tìm thấy hình phạt trong các tài khoản Google Webmaster của họ.

Điều này có nghĩa rằng các trang web scraper đang ngày càng trở nên một vấn đề hơn là khi họ có lịch sử? Không nhất thiết, tuy nhiên đó có thể là một phần lý do .

Đôi khi các trang web scraper không nhất thiết phải xếp hạng cho các từ khóa kiếm tiền lên hàng đầu, nhưng có nó có phổ biến đủ làm lộn xộn trang kết quả tìm kiếm sau khi top 10, có thể là để các trang scraper đó ở trang 2, trang 3 trở lên ở kết quả trả về. Và hiện tại cách duy nhất để bảo vệ nội dung gốc của mình đó là đăng ký tài khoản trên trang DMCA.

Google không nói chính xác những gì họ đang làm với các dữ liệu này . Được này được sử dụng như một cách dễ dàng cho các webmaster để có được các trang web scraper ra khỏi chỉ mục mà không cần phải sử dụng DMCA ? Được họ sử dụng nó để cải thiện các thuật toán của họ để thử và xác định nơi mà nội dung có nguồn gốc là so với nội dung scraper ? Google không nói, mặc dù tôi nghi ngờ nó đang được sử dụng để cải thiện các thuật toán bằng cách nhìn thấy như thế nào và lý do tại sao chọc được xếp hạng.

Điều này chắc chắn có dấu hiệu của dự án là một trong những thành viên của nhóm thư rác đang làm việc trên . Trở lại vào tháng Tám, Cutts cũng yêu cầu cho ví dụ về các trang web nhỏ mà không được xếp hạng là tốt, mặc dù chất lượng cao , mặc dù một mà cụ thể có một sự từ bỏ nói rằng những bài nộp sẽ không ảnh hưởng đến bảng xếp hạng.

Đó là điều tuyệt vời mà Google lựa chọn một lần nữa nhìn vào các trang web scraper , bởi vì nó đã được khá khó chịu cho các webmaster trong nhiều năm , ngay cả khi họ không nhất thiết phải xếp hạng cao .

Hy vọng rằng chúng ta sẽ thấy một cái mới về cách chọc được xử lý trong một bản cập nhật tương lai của thuật toán tìm kiếm của Google.

Chúc các bạn học SEO thành công