DevToys Web Pro iconDevToys Web ProBlogue
Avalie-nos:
Experimente a extensão do navegador:

Conversor de Texto ↔ Unicode

Modo
Formato

Texto

  • Unicode

  • Detalhes técnicos

    Como funciona o Conversor de Texto ↔ Unicode

    O Que a Ferramenta Faz

    A ferramenta Texto ↔ Unicode converte texto de e para pontos de código Unicode em várias notações: U+XXXX, escapes de JavaScript (\uXXXX ou \u{XXXXX}), decimal, 0xHEX e entidades numéricas HTML (&#N; ou &#xHEX;). O descodificador é permissivo — reconhece qualquer combinação destas notações intercaladas com texto e extrai os pontos de código. O codificador permite-lhe escolher o formato de saída e um separador entre pontos de código.

    Casos de Uso Comuns para Programadores

    Os programadores frontend usam a ferramenta para traduzir emoji e caracteres CJK em sequências de escape ASCII seguras para ficheiros JSON, código-fonte ou transporte através de canais restritivos. Os engenheiros de localização verificam os pontos de código exatos usados numa string traduzida. A ferramenta também é útil para detetar caracteres invisíveis ou semelhantes (homóglifos, zero-width joiners, marcas RTL) escondidos dentro de um excerto copiado.

    Formatos, Tipos ou Variantes de Dados

    A notação padrão Unicode é U+XXXX para o Plano Multilingue Básico e U+XXXXX para planos suplementares. Os escapes de JavaScript usam \uXXXX para o BMP e \u{XXXXX} (ES2015+) para o intervalo completo. O HTML aceita entidades numéricas (decimal &#N; ou hex &#xN;). Os formatos decimal simples e 0xHEX fazem round-trip através de codePointAt / fromCodePoint sem interpretação adicional. Os caracteres astrais (emoji como 🌍) são representados como um único ponto de código acima de U+FFFF.

    Erros Comuns e Casos Limite

    Os caracteres astrais não podem ser expressos com a forma mais antiga \uXXXX porque cada escape tem apenas 4 dígitos hex — use \u{...} ou um par substituto (surrogate pair). Pontos de código acima de U+10FFFF são inválidos segundo a especificação Unicode e serão rejeitados. Marcas combinantes e sequências de emoji ZWJ aparecem como vários pontos de código, embora sejam renderizadas como um único glifo. O descodificador não interpreta entidades nomeadas HTML (©, &) — use um descodificador HTML dedicado para essas.

    Quando Usar Esta Ferramenta vs Código

    Use a ferramenta no browser para inspeção rápida, geração de sequências de escape e caça a homóglifos. Em código, prefira as APIs nativas de strings da linguagem (`String.fromCodePoint`, `Array.from(str)` para iteração por pontos de código em JS; `chr` e `ord` em Python; `Character.toCodePoint` em Java) e bibliotecas ICU completas quando precisar de normalização (NFC/NFD), case folding ou segmentação por clusters de grafemas.