top of page

Identificar caracteres existentes em um arquivo txt com python

  • Foto do escritor: Amanda Nascimento
    Amanda Nascimento
  • há 30 minutos
  • 1 min de leitura

O que são caracteres especiais?


  • Tudo o que não é letra (a–z, A–Z)

  • Tudo o que não é número (0–9)

  • Ou seja, não são alfanuméricos

Tipo

Exemplos

Pontuação

.,:;!?()[]{}"'

Símbolos

@#$%^&*+=/|<>~

Acentuados

á, ç, é, ñ, ê, ã

Espaços invisíveis

tab \t, quebra de linha \n

Unicode avançado

•, —, “, ”, …, ©, etc.


A função em Python abaixo retorna os tipos de caracteres encontrados em um arquivo txt, pegando tudo que não for letra/número nem espaço e mostra também a quantidade.



from collections import Counter

def caracteres_especiais(caminho_arquivo):
    with open(caminho_arquivo, 'r', encoding='utf-8') as f:
        conteudo = f.read()

        contagem = Counter(conteudo)

        especiais = sorted([
            c for c in contagem 
            if not c.isalnum() and not c.isspace() or ord(c) > 127
        ])

        print("Caracteres especiais encontrados:")
        for c in especiais:
            print(f"{repr(c)} - Unicode: {ord(c)} quantidade: {contagem[c]}")

# Chamada da função com o nome correto do arquivo
caracteres_especiais("SLD1306052024003511.txt")

Posts recentes

Ver tudo

© 2017-2025  Criado e desenvolvido por Amanda Nascimento

  • Discord
  • GitHub
  • youtube
  • LinkedIn Amanda
bottom of page