Skip to content

WebHarvester é um script Python que facilita a coleta de arquivos de páginas da web. Com ele, você pode baixar todos os arquivos vinculados em uma página da web com apenas alguns comandos.

License

Notifications You must be signed in to change notification settings

marciolopesjr/WebHarvester

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 

Repository files navigation

WebHarvester - Colha Arquivos da Web com Facilidade

Descrição

WebHarvester é um script Python que facilita a coleta de arquivos de páginas da web. Com ele, você pode baixar todos os arquivos vinculados em uma página da web com apenas alguns comandos.

Funcionalidades

  • Faz a requisição HTTP para obter o conteúdo da página web.
  • Analisa o HTML da página para encontrar todos os links.
  • Baixa os arquivos linkados e os salva em um diretório especificado.

Requisitos

  • Python 3.x
  • Bibliotecas Python: requests, beautifulsoup4

Instalação

  1. Clone o repositório:
    git clone https://github.com/marciolopesjr/WebHarvester.git
    cd WebHarvester.git
  2. Instale as dependências:
    pip install requests beautifulsoup4
  3. Edite o script web_harvester.py para especificar a URL da página da qual deseja baixar os arquivos e o diretório de destino:
       # URL da página da qual deseja baixar os arquivos
      page_url = 'https://exemplo.com/pagina-com-links'
      # Diretório de destino para salvar os arquivos
      download_folder = 'arquivos_baixados'
  4. Execute o script:
    python web_harvester.py
    

Licença

Este projeto está licenciado sob a licença MIT. Veja o arquivo LICENSE para mais detalhes.

Feito com ♥ e Python por Márcio Lopes.

About

WebHarvester é um script Python que facilita a coleta de arquivos de páginas da web. Com ele, você pode baixar todos os arquivos vinculados em uma página da web com apenas alguns comandos.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages