scrapy_parser_pep# scrapy_parser_pep

Парсер документов PEP на базе фреймворка Scrapy.

Домен для парсинга https://peps.python.org/.

Парсер собирает информацию и выводит собранную информацию в два файла .csv:
  - в первый файл - список всех PEP: номер, название и статус;
  - во второй файл - сводку по статусам PEP (количество документов в каждом статусе)
Метод parse собирает ссылки на документы PEP.
Метод parse_pep парсит страницы с документами. 

Парсер сохраняет данные в файлы .csv в директорию results.

Как запустить проект:

Запуск проекта осуществляется из директории pep_parse

Пример запуска работы (в виртуальной среде):
  - scrapy crawl pep

Клонирование репозитория

git clone git@github.com:bauklu/scrapy_parser_pep.git cd https://github.com/bauklu

Настройка виртуального окружения

.venv/bin/activate

Сайт

https://peps.python.org

Инструменты и стек:

python scrapy csv

Информация об авторе:

Баукова Людмила

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
pep_parse		pep_parse
results		results
tests		tests
.flake8		.flake8
.gitignore		.gitignore
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

scrapy_parser_pep# scrapy_parser_pep

Парсер документов PEP на базе фреймворка Scrapy.

Как запустить проект:

Клонирование репозитория

Настройка виртуального окружения

Сайт

Инструменты и стек:

Информация об авторе:

About

Uh oh!

Releases

Packages

Languages

bauklu/scrapy_parser_pep

Folders and files

Latest commit

History

Repository files navigation

scrapy_parser_pep# scrapy_parser_pep

Парсер документов PEP на базе фреймворка Scrapy.

Как запустить проект:

Клонирование репозитория

Настройка виртуального окружения

Сайт

Инструменты и стек:

Информация об авторе:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages