📩 Spam Detector – Phân loại tin nhắn rác 🔎 Bài làm về gì?
Dự án xây dựng hệ thống phân loại tin nhắn SMS thành 2 nhóm:
Ham: Tin nhắn hợp lệ.
Spam: Tin nhắn rác (quảng cáo, lừa đảo…).
Người dùng có thể nhập một tin nhắn trực tiếp trên giao diện web, hệ thống sẽ dự đoán ngay kết quả.
⚙️ Công nghệ, thuật toán, ngôn ngữ lập trình
Ngôn ngữ: Python
Thư viện:
Flask (xây dựng web app)
Scikit-learn (xử lý dữ liệu & huấn luyện mô hình)
Pandas, Numpy (tiền xử lý dữ liệu)
TfidfVectorizer (biểu diễn văn bản)
Thuật toán chính: Multinomial Naive Bayes (một biến thể của Naive Bayes, rất phù hợp cho dữ liệu văn bản).
Trang chính: form nhập tin nhắn và nút “Dự đoán”.
Kết quả: hiển thị “Spam” hoặc “Ham” sau khi xử lý.

