Skip to main content

Xây dựng bộ lọc bình luận spam trên Facebook

Bài viết này ghi lại quá trình mà tôi hỗ trợ xử lý một fan-page ngăn chặn các bình luận spam. Tôi đã sử dụng những công cụ nào và ngăn chặn spam ra sao? Cùng theo dõi nhé!

Xác định tình huống xảy ra

12:00 sáng, tôi nhận được tin nhắn từ một bạn nữ tên Ánh với nội dung...
Chặn bình luận spam trên Facebook
Tôi liền gõ tên page vào thanh tìm kiếm của Facebook và nhanh chóng tìm ra page của nạn nhân. Đây là một fan-page nhỏ của trường học với mục đích cho các sinh viên cùng trường chia sẻ Confessions (trào lưu này xuất hiện cũng lâu rồi nên chắc tôi không cần giới thiệu nhỉ?).

Kéo xuống đọc lướt qua mấy bài đăng gần đây, tình hình đúng là có vẻ tệ khi mà hầu như bài nào cũng bị spam khoảng 200-300 bình luận có nội dung tiếng Ấn Độ như thế này:
Chặn bình luận spam trên Facebook

Có thể bạn đang thắc mắc tại sao tôi biết đây là tiếng Ấn Độ đúng không? Rất đơn giản, hệ thống phát hiện ngôn ngữ của Google Dịch sẽ nói cho bạn biết!
Chặn bình luận spam trên Facebook

Phân tích và tìm ra những điểm quan trọng

Sau khi tìm hiểu trực tiếp tại fan-page, tôi nhận thấy những điểm quan trọng sau:
  • Khả năng tấn công bởi đối thủ là rất thấp vì đây là một page trường học nhỏ chỉ với khoảng 5000 lượt thích, do đó khả năng cao hơn là do một sinh viên trong trường cố tình phá.
  • Các bình luận được tạo ra bởi một hệ thống Auto Comment (sử dụng access token) với Cơ sở dữ liệu là tài khoản người dùng Facebook từ Ấn Độ.
  • Các bình luận có tần suất lặp lại nhiều: danh sách bình luận được chuẩn bị sẵn như từ điển chứ không phải tạo ngẫu nhiên.

Tìm kiếm giải pháp ngăn chặn

Sau khi phân tích thì tôi nghĩ ra 2 giải pháp:
  1. Do các tài khoản bình luận đều là người dùng Ấn Độ nên chúng ta có thể viết công cụ kiểm tra tên người dùng để tự động xóa. Có thể áp dụng tương tự với nội dung bình luận.
  2. Do tần suất lặp từ nhiều nên chúng ta có thể xây dựng rule kết hợp với tính năng bộ lọc từ của Facebook để tự động ẩn toàn bộ bình luận spam.
Phương án 2 khả thi hơn do việc kiểm tra tên người dùng có thể sẽ có người bị xóa nhầm vì ở Việt Nam dùng tên đặc biệt hay nickname khá nhiều.

Xây dựng bộ lọc bình luận spam trên Facebook

Đầu tiên, tôi sử dụng công cụ Facebook Comment Manager để quét toàn bộ bình luận trong một bài đăng gần đây của page.
Chặn bình luận spam trên Facebook

Sau đó, lấy ra toàn bộ bình luận và sử dụng một công cụ SEO để phân tích mật độ từ khóa xuất hiện.
Chặn bình luận spam trên Facebook

Lấy các từ khóa xuất hiện từ 2, 3 lần trở lên là ta đã có được bộ lọc từ. Việc còn lại là vào cài đặt của page để thêm bộ lọc thôi! Xem hướng dẫn của Facebook tại đây nếu bạn chưa biết.

Share this with your friends
Loading...