Skip to content

bauklu/scrapy_parser_pep

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

scrapy_parser_pep# scrapy_parser_pep

Парсер документов PEP на базе фреймворка Scrapy.

Домен для парсинга https://peps.python.org/.

Парсер собирает информацию и выводит собранную информацию в два файла .csv:
  - в первый файл - список всех PEP: номер, название и статус;
  - во второй файл - сводку по статусам PEP (количество документов в каждом статусе)
Метод parse собирает ссылки на документы PEP.
Метод parse_pep парсит страницы с документами. 

Парсер сохраняет данные в файлы .csv в директорию results.

Как запустить проект:

Запуск проекта осуществляется из директории pep_parse

Пример запуска работы (в виртуальной среде):
  - scrapy crawl pep

Клонирование репозитория

git clone git@github.com:bauklu/scrapy_parser_pep.git cd https://github.com/bauklu

Настройка виртуального окружения

.venv/bin/activate

Сайт

https://peps.python.org

Инструменты и стек:

python scrapy csv

Информация об авторе:

Баукова Людмила

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages