Skip to content

Классификатор спама: TF-IDF + Naive Bayes (sklearn)

Notifications You must be signed in to change notification settings

chapppington/spam_classifier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Spam Classifier

Классификатор спама: TF-IDF + Naive Bayes (sklearn), без нейросетей.

Установка

poetry install

Запуск

poetry run python main.py

При первом запуске обучится на spam.csv и сохранит модель в spam_model.joblib. Дальше модель подхватывается из файла.

Использование

from spam_classifier import SpamClassifier
from utils import print_predictions

classifier = SpamClassifier()
predictions = classifier.predict(["Your text here"])
print_predictions(["Your text here"], predictions)

Данные

CSV с колонками v1 (ham/spam) и v2 (текст). Путь к данным и модели можно задать: SpamClassifier(model_path="...", csv_path="...").

About

Классификатор спама: TF-IDF + Naive Bayes (sklearn)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages