Identificar caracteres existentes em um arquivo txt com python
- Amanda Nascimento
- há 30 minutos
- 1 min de leitura
O que são caracteres especiais?
Tudo o que não é letra (a–z, A–Z)
Tudo o que não é número (0–9)
Ou seja, não são alfanuméricos
Tipo | Exemplos |
Pontuação | .,:;!?()[]{}"' |
Símbolos | @#$%^&*+=/|<>~ |
Acentuados | á, ç, é, ñ, ê, ã |
Espaços invisíveis | tab \t, quebra de linha \n |
Unicode avançado | •, —, “, ”, …, ©, etc. |
A função em Python abaixo retorna os tipos de caracteres encontrados em um arquivo txt, pegando tudo que não for letra/número nem espaço e mostra também a quantidade.

from collections import Counter
def caracteres_especiais(caminho_arquivo):
with open(caminho_arquivo, 'r', encoding='utf-8') as f:
conteudo = f.read()
contagem = Counter(conteudo)
especiais = sorted([
c for c in contagem
if not c.isalnum() and not c.isspace() or ord(c) > 127
])
print("Caracteres especiais encontrados:")
for c in especiais:
print(f"{repr(c)} - Unicode: {ord(c)} quantidade: {contagem[c]}")
# Chamada da função com o nome correto do arquivo
caracteres_especiais("SLD1306052024003511.txt")