DevToys Web Pro iconDevToys Web ProBlog
Avalie-nos:
Experimente a extensão do navegador:

Conversor de Texto ↔ Unicode

Modo
Formato

Texto

  • Unicode

  • Detalhes técnicos

    Como funciona o conversor de Texto ↔ Unicode

    O Que a Ferramenta Faz

    A ferramenta Texto ↔ Unicode converte texto de e para pontos de código Unicode em várias notações: U+XXXX, escapes de JavaScript (\uXXXX ou \u{XXXXX}), decimal, 0xHEX e entidades numéricas HTML (&#N; ou &#xHEX;). O decodificador é permissivo — ele reconhece qualquer combinação dessas notações intercaladas com texto e extrai os pontos de código. O codificador permite escolher o formato de saída e um separador entre pontos de código.

    Casos de Uso Comuns para Desenvolvedores

    Desenvolvedores frontend usam a ferramenta para traduzir emojis e caracteres CJK em sequências de escape ASCII seguras para arquivos JSON, código-fonte ou transporte por canais restritivos. Engenheiros de localização verificam os pontos de código exatos usados em uma string traduzida. A ferramenta também é útil para identificar caracteres invisíveis ou parecidos (homóglifos, zero-width joiners, marcas RTL) escondidos dentro de um trecho copiado.

    Formatos de Dados, Tipos ou Variantes

    A notação padrão do Unicode é U+XXXX para o Basic Multilingual Plane e U+XXXXX para planos suplementares. Escapes de JavaScript usam \uXXXX para BMP e \u{XXXXX} (ES2015+) para o intervalo completo. HTML aceita entidades numéricas (decimal &#N; ou hex &#xN;). Os formatos decimal simples e 0xHEX fazem round-trip via codePointAt / fromCodePoint sem interpretação adicional. Caracteres astrais (emojis como 🌍) são representados como um único ponto de código acima de U+FFFF.

    Armadilhas Comuns e Casos de Borda

    Caracteres astrais não podem ser expressos com a forma antiga \uXXXX porque cada escape tem apenas 4 dígitos hex — use \u{...} ou um par substituto (surrogate pair). Pontos de código acima de U+10FFFF são inválidos segundo a especificação Unicode e serão rejeitados. Marcas combinantes e sequências de emoji com ZWJ aparecem como múltiplos pontos de código, embora sejam renderizadas como um único glifo. O decodificador não interpreta entidades nomeadas de HTML (©, &) — use um decodificador HTML dedicado para isso.

    Quando Usar Esta Ferramenta vs Código

    Use a ferramenta no navegador para inspeção rápida, geração de sequências de escape e caça a homóglifos. Em código, prefira APIs nativas de strings da linguagem (`String.fromCodePoint`, `Array.from(str)` para iteração por ponto de código em JS; `chr` e `ord` em Python; `Character.toCodePoint` em Java) além de bibliotecas ICU completas quando você precisar de normalização (NFC/NFD), case folding ou segmentação de clusters de grafemas.