Skip to content

Repositório para disponibilização de bases de dados do Wikipedia e Simple Wikipedia pré-processadas, além de scripts de pré-processamento e geração de bases em Python.

Notifications You must be signed in to change notification settings

LeviMatheus/tcc-readability-score-level

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Trabalho de Conclusão de Curso: Classificador de legibilidade de textos em língua inglesa

HTML5 CSS Boostrap Python VSCode Wikipedia NumPy Pandas Git

Este repositório é para disponibilização de todo o material referente ao meu Trabalho de conclusão de curso de 2021, com tema, Classificador de legibilidade de textos em língua inglesa.

O trabalho desenvolvido gerou um protótipo de ferramenta capaz de, com um texto de entrada em língua inglesa, classificar o conteúdo em níveis de legibilidade, exemplo: 'fácil','médio' ou 'difícil'.

Para acessar o documento publicado e entender mais a fundo o objetivo deste protótipo e scripts criados acesse Aqui.

Na pasta 'Scripts', consta diversos scripts em Python para préprocessamento das bases da Wikipedia e Simple wikipedia. Na pasta 'bases-wikiANDsimple', consta as versões das bases utilizadas no trabalho para processamento, separadas e unificadas. Na pasta 'SaídaCSV-e-Relatório', consta os relatórios em formato CSV (separados por vírgula) das bases processadas.

Foi utilizada a linguagem Python em conjunto com algumas bibliotecas de préprocessamento e legibilidade de textos.

About

Repositório para disponibilização de bases de dados do Wikipedia e Simple Wikipedia pré-processadas, além de scripts de pré-processamento e geração de bases em Python.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published