Conversor de Texto ↔ Unicode
Texto
Unicode
Detalhes técnicos
Como funciona o Conversor de Texto ↔ Unicode
O Que a Ferramenta Faz
A ferramenta Texto ↔ Unicode converte texto de e para pontos de código Unicode em várias notações: U+XXXX, escapes de JavaScript (\uXXXX ou \u{XXXXX}), decimal, 0xHEX e entidades numéricas HTML (&#N; ou &#xHEX;). O descodificador é permissivo — reconhece qualquer combinação destas notações intercaladas com texto e extrai os pontos de código. O codificador permite-lhe escolher o formato de saída e um separador entre pontos de código.
Casos de Uso Comuns para Programadores
Os programadores frontend usam a ferramenta para traduzir emoji e caracteres CJK em sequências de escape ASCII seguras para ficheiros JSON, código-fonte ou transporte através de canais restritivos. Os engenheiros de localização verificam os pontos de código exatos usados numa string traduzida. A ferramenta também é útil para detetar caracteres invisíveis ou semelhantes (homóglifos, zero-width joiners, marcas RTL) escondidos dentro de um excerto copiado.
Formatos, Tipos ou Variantes de Dados
A notação padrão Unicode é U+XXXX para o Plano Multilingue Básico e U+XXXXX para planos suplementares. Os escapes de JavaScript usam \uXXXX para o BMP e \u{XXXXX} (ES2015+) para o intervalo completo. O HTML aceita entidades numéricas (decimal &#N; ou hex &#xN;). Os formatos decimal simples e 0xHEX fazem round-trip através de codePointAt / fromCodePoint sem interpretação adicional. Os caracteres astrais (emoji como 🌍) são representados como um único ponto de código acima de U+FFFF.
Erros Comuns e Casos Limite
Os caracteres astrais não podem ser expressos com a forma mais antiga \uXXXX porque cada escape tem apenas 4 dígitos hex — use \u{...} ou um par substituto (surrogate pair). Pontos de código acima de U+10FFFF são inválidos segundo a especificação Unicode e serão rejeitados. Marcas combinantes e sequências de emoji ZWJ aparecem como vários pontos de código, embora sejam renderizadas como um único glifo. O descodificador não interpreta entidades nomeadas HTML (©, &) — use um descodificador HTML dedicado para essas.
Quando Usar Esta Ferramenta vs Código
Use a ferramenta no browser para inspeção rápida, geração de sequências de escape e caça a homóglifos. Em código, prefira as APIs nativas de strings da linguagem (`String.fromCodePoint`, `Array.from(str)` para iteração por pontos de código em JS; `chr` e `ord` em Python; `Character.toCodePoint` em Java) e bibliotecas ICU completas quando precisar de normalização (NFC/NFD), case folding ou segmentação por clusters de grafemas.