NLP-анализ Telegram-канала The Blueprint за март–май 2025: эмбеддинги + векторный поиск (FAISS), n-граммы, таймлайны событий/трендов.
- 📓 Основной ноутбук:
notebooks/TheBlueprint_project_clean.ipynb(кнопка Colab выше). - ⚡ TL;DR: Весенняя повестка канала следует календарю индустрии; мода – брендоцентрична, рубрика о культуре завязана на новостях и ивентах, сфера красоты и здоровья фокусируется на бьюти-советах, косметике, образе жизни и зависит от сезона. Метод дал быстрые и полезные срезы; для «идеала» нужны более мелкие чанки, детальнее запросы и лёгкая пост-фильтрация.
- 🖼 Превью результатов:
sentence-transformers (paraphrase-multilingual-mpnet-base-v2), FAISS, pandas, numpy, scikit-learn (TfidfVectorizer), matplotlib.
В Colab: нажмите на бейдж выше и следуйте ячейкам (загрузите data/result.json при запросе).
Локально:
git clone https://github.com/ghostfr1end/the-blueprint-nlp.git
cd the-blueprint-nlp
python -m venv .venv && source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install -r requirements.txt
jupyter notebook notebooks/TheBlueprint_project_clean.ipynb
