Este projeto automatiza a extração de dados de pedidos em PDF e a organização de arquivos por divulgador. Desenvolvido em colaboração estratégica com Inteligência Artificial, ele representa um marco na minha transição de carreira para a tecnologia. Mesmo atuando em um cargo não-tech (Assistente Comercial), utilizei o mindset de resolução de problemas para transformar horas de triagem manual em segundos de processamento automático, provando que a habilidade de guiar ferramentas de IA para gerar valor real ao negócio é um diferencial competitivo.
No meu fluxo de trabalho como Assistente Comercial, a separação de pedidos de entrega de materiais era um gargalo operacional. O sistema de gestão emite os documentos em lotes desordenados, o que resultava em:
- Triagem Manual: Necessidade de separar centenas de folhas fisicamente após a impressão.
- Ineficiência: Alto consumo de tempo em tarefas repetitivas de baixo valor agregado.
- Risco de Erro: Possibilidade de mistura de pedidos entre diferentes divulgadores.
Para eliminar o trabalho manual, foi desenvolvida uma solução inteligente que processa os documentos digitais antes mesmo da impressão. O sistema utiliza Python e bibliotecas de processamento de PDF para:
- Extração Inteligente: Identifica automaticamente o Divulgador, Escola e Quantidades através de padrões de texto (Regex).
- Organização em Lote: Move cada arquivo para sua respectiva pasta de divulgador de forma instantânea.
- Relatório Consolidado: Gera uma planilha Excel com o resumo de todas as quantidades, facilitando o controle comercial.
- Impressão Pronta: Permite que a impressão seja feita diretamente por pastas, saindo da impressora já organizada por responsável.
- Acesso Digital Facilitado: A estrutura de pastas serve como um backup organizado. Caso um divulgador perca sua via impressa, o acesso e reenvio do arquivo digital é imediato e preciso.
Esta estrutura separa o "cérebro" (código) dos "músculos" (dados) e da "memória" (logs).
CommercialFlow-Bot/
├── data/ # Gestão de arquivos
│ ├── input/ # PDFs crus (produção) - [🔐 Privado]
│ ├── output/ # Resultados gerados - [🔐 Privado]
│ └── sample/ # Arquivos fictícios para demonstração [Versionado]
├── src/ # O Coração (Código-fonte)
│ ├── __init__.py # Torna a pasta um pacote Python
│ ├── main.py # Ponto de entrada (Orquestrador)
│ ├── core.py # Lógica principal (Regex e extração de PDF)
│ └── utils.py # Apoio (Logs e limpeza de nomes)
├── logs/ # Histórico de execução para auditoria
├── scripts/ # Facilitadores (Scripts de apoio)
├── tests/ # Testes unitários
├── .gitignore # Proteção de dados sensíveis
├── README.md # Documentação do projeto
└── requirements.txt # Bibliotecas necessárias
Siga este passo a passo para executar a automação:
- Preparação: Coloque todos os arquivos PDF que deseja processar na pasta
data/input/. - Dependências: Garanta que as bibliotecas estão instaladas (veja seção abaixo).
- Execução: Dê um clique duplo no arquivo
run.batna raiz do projeto. - Resultados:
- O relatório Excel será gerado em
data/output/relatorio_quantidades.xlsx. - Os arquivos organizados estarão em
data/output/revistas_cartazes/. - O histórico detalhado da execução estará em
logs/.
- O relatório Excel será gerado em
Para testar o programa sem usar dados reais, este repositório inclui uma pasta data/sample/ com arquivos PDF fictícios:
- Copie os arquivos de
data/sample/paradata/input/. - Execute o
run.bat. - Verifique os resultados processados na pasta
data/output/.
Instale as bibliotecas necessárias utilizando o comando abaixo:
pip install -r requirements.txtutils.py: Configuração de logs, criação de pastas e sanitização de nomes.core.py: Inteligência de abertura de PDFs, Regex e manipulação de arquivos.main.py: Orquestrador curto que chama as fases de extração e organização.