Skip to content

Description: NLP-анализ Telegram-канала The Blueprint (март–май 2025): эмбеддинги, FAISS, таймлайны, n-граммы

License

Notifications You must be signed in to change notification settings

ghostfr1end/the-blueprint-nlp

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

the-blueprint-nlp

Open In Colab

NLP-анализ Telegram-канала The Blueprint за март–май 2025: эмбеддинги + векторный поиск (FAISS), n-граммы, таймлайны событий/трендов.

Быстро посмотреть

  • 📓 Основной ноутбук: notebooks/TheBlueprint_project_clean.ipynb (кнопка Colab выше).
  • ⚡ TL;DR: Весенняя повестка канала следует календарю индустрии; мода – брендоцентрична, рубрика о культуре завязана на новостях и ивентах, сфера красоты и здоровья фокусируется на бьюти-советах, косметике, образе жизни и зависит от сезона. Метод дал быстрые и полезные срезы; для «идеала» нужны более мелкие чанки, детальнее запросы и лёгкая пост-фильтрация.
  • 🖼 Превью результатов:
    • Таймлайн упоминаний (ивенты/бренды/микротренды):
      timeline
    • Топ биграмм по рубрикам (бар-чарты):
      bars

Стек

sentence-transformers (paraphrase-multilingual-mpnet-base-v2), FAISS, pandas, numpy, scikit-learn (TfidfVectorizer), matplotlib.

Как запустить

В Colab: нажмите на бейдж выше и следуйте ячейкам (загрузите data/result.json при запросе).
Локально:

git clone https://github.com/ghostfr1end/the-blueprint-nlp.git
cd the-blueprint-nlp
python -m venv .venv && source .venv/bin/activate   # Windows: .venv\Scripts\activate
pip install -r requirements.txt
jupyter notebook notebooks/TheBlueprint_project_clean.ipynb

About

Description: NLP-анализ Telegram-канала The Blueprint (март–май 2025): эмбеддинги, FAISS, таймлайны, n-граммы

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published