ColetorRI

Esse coletor é foi feito como Trabalho Prático da disciplina de Recuperação de Dados do CEFET-MG.

Regras do bot

Esse bot respeita as diretivas dos respectivos robots.txt das URLs alvo escolhidas. Esse bot não tenta coletar documentos que estão são privados (/private/) ou não permitidos (/not-allowed). Respeitando as regras da seguinte forma:

User-agent: Bot              # bot
Disallow: /private/          # disallow this directory
User-agent: *                # any robot
Disallow: /not-allowed/      # disallow this directory

URLs coletadas

Para cada aluno foram coletadas as respectivas URLs indicadas pelo enunciado do Trabalho, sendo elas:

globo.com 
amazon.com
americanas.com.br
reuters.com

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
ColetorCodingDojo1		ColetorCodingDojo1
Resultados		Resultados
libs_coletor		libs_coletor
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ColetorRI

Regras do bot

URLs coletadas

About

Releases

Packages

Contributors 2

Languages

Arthuresm/ColetorRI

Folders and files

Latest commit

History

Repository files navigation

ColetorRI

Regras do bot

URLs coletadas

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages