Variáveis do tipo texto são muito comuns nos bancos de dados e geralmente são
colunas que dão bastante trabalho para serem manipuladas. É muito comun encontrar
bancos de dados em que os textos de uma coluna não estão padronizados, por exemplo
uma coluna Estado
em que são encontrados "SP", "sp", "Sao Paulo", "São Paulo", etc
todas as variações indicando o mesmo estado.
Para manipular esses textos o R possui diversas funções para manipular textos, no entanto,
as funções do base
não possuem um interface consistente e parece que cada uma
tem a sua forma de passar os parâmetros, dificultando o processo durante a análise.
Por isso, é recomendado usar o pacote stringr
que possui a sintaxe consistente
permitindo que o usuário realize qualquer manipulação com textos com maior facilidade.
- Adicionar exemplos de cada grupo no 02-regex