Este repositório é para disponibilização de todo o material referente ao meu Trabalho de conclusão de curso de 2021, com tema, Classificador de legibilidade de textos em língua inglesa.
O trabalho desenvolvido gerou um protótipo de ferramenta capaz de, com um texto de entrada em língua inglesa, classificar o conteúdo em níveis de legibilidade, exemplo: 'fácil','médio' ou 'difícil'.
Para acessar o documento publicado e entender mais a fundo o objetivo deste protótipo e scripts criados acesse Aqui.
Na pasta 'Scripts', consta diversos scripts em Python para préprocessamento das bases da Wikipedia e Simple wikipedia. Na pasta 'bases-wikiANDsimple', consta as versões das bases utilizadas no trabalho para processamento, separadas e unificadas. Na pasta 'SaídaCSV-e-Relatório', consta os relatórios em formato CSV (separados por vírgula) das bases processadas.
Foi utilizada a linguagem Python em conjunto com algumas bibliotecas de préprocessamento e legibilidade de textos.