Skip to content

Скрипт на Python для автоматического сбора информации о компаниях из каталога 2ГИС. Полученные данные сохраняются в формате CSV и могут использоваться для анализа или интеграции в другие системы.

Notifications You must be signed in to change notification settings

Solrikk/2gisTrace

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

2gisTrace

Скрипт на Python для автоматического сбора информации о компаниях из каталога 2ГИС. Полученные данные сохраняются в формате CSV и могут использоваться для анализа или интеграции в другие системы.

Возможности

  • Поиск компаний по произвольному запросу
  • Сбор подробных сведений: название, адрес, телефон, веб‑сайт и режим работы
  • Headless‑режим работы браузера
  • Экспорт в CSV с автоматическим созданием каталога parsed_data
  • Настраиваемые параметры для разных категорий бизнеса

Требования

  • Python 3.11+
  • Google Chrome (последняя версия)
  • зависимости из pyproject.toml (selenium, webdriver-manager, flask)

Установка

git clone https://github.com/Solrikk/2gisTrace
cd 2gisTrace
pip install -r requirements.txt

Использование

Запустите основной скрипт:

python src/main.py

По умолчанию ищутся компании, связанные с детской мебелью. Чтобы изменить поисковый запрос, отредактируйте переменную QUERY в src/main.py.

Результаты будут сохранены в каталоге parsed_data/kids_furniture_companies.csv.

Структура проекта

2gisTrace/
├── src/
│   └── main.py          # основной скрипт парсинга
├── parsed_data/         # результаты работы (создаётся автоматически)
├── pyproject.toml       # конфигурация проекта и зависимости
├── requirements.txt     # список зависимостей
└── README.md            # документация

Примечание

Инструмент предназначен для образовательных целей. Соблюдайте правила использования 2ГИС и избегайте чрезмерной нагрузки на их сервисы.

About

Скрипт на Python для автоматического сбора информации о компаниях из каталога 2ГИС. Полученные данные сохраняются в формате CSV и могут использоваться для анализа или интеграции в другие системы.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages