What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Convertitore Testo ↔ Unicode

Modalità

Formato

Testo

Unicode

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Dettagli tecnici

Come funziona il convertitore Testo ↔ Unicode

Cosa fa lo strumento

Lo strumento Testo ↔ Unicode converte il testo da e verso i punti di codice Unicode in più notazioni: U+XXXX, escape JavaScript (\uXXXX o \u{XXXXX}), decimale, 0xHEX e entità numeriche HTML (&#N; o &#xHEX;). Il decoder è permissivo: riconosce qualsiasi combinazione di queste notazioni intervallate da testo ed estrae i punti di codice. L'encoder ti consente di scegliere il formato di output e un separatore tra i punti di codice.

Casi d’uso comuni per sviluppatori

Gli sviluppatori frontend usano lo strumento per tradurre emoji e caratteri CJK in sequenze di escape ASCII sicure per file JSON, codice sorgente o trasporto su canali restrittivi. Gli ingegneri di localizzazione verificano i punti di codice esatti usati in una stringa tradotta. Lo strumento è utile anche per individuare caratteri invisibili o simili (omoglifi, zero-width joiner, marcatori RTL) nascosti dentro uno snippet copiato.

Formati, tipi o varianti dei dati

La notazione standard Unicode è U+XXXX per il Basic Multilingual Plane e U+XXXXX per i piani supplementari. Gli escape JavaScript usano \uXXXX per il BMP e \u{XXXXX} (ES2015+) per l'intero intervallo. HTML accetta entità numeriche (decimali &#N; o esadecimali &#xN;). I formati decimale semplice e 0xHEX fanno round-trip tramite codePointAt / fromCodePoint senza ulteriori interpretazioni. I caratteri astrali (emoji come 🌍) sono rappresentati come un singolo punto di codice sopra U+FFFF.

Errori comuni e casi limite

I caratteri astrali non possono essere espressi con la vecchia forma \uXXXX perché ogni escape è di sole 4 cifre esadecimali: usa \u{...} o una coppia surrogata. I punti di codice sopra U+10FFFF non sono validi secondo la specifica Unicode e verranno rifiutati. I segni diacritici combinanti e le sequenze emoji ZWJ appaiono come più punti di codice anche se vengono renderizzati come un singolo glifo. Il decoder non interpreterà le entità HTML con nome (©, &): per quelle usa un decoder HTML dedicato.

Quando usare questo strumento rispetto al codice

Usa lo strumento nel browser per un'ispezione rapida, la generazione di sequenze di escape e la caccia agli omoglifi. Nel codice, preferisci le API native del linguaggio per le stringhe (`String.fromCodePoint`, `Array.from(str)` per l'iterazione per punto di codice in JS; `chr` e `ord` in Python; `Character.toCodePoint` in Java) più librerie ICU complete quando ti servono normalizzazione (NFC/NFD), case folding o segmentazione in cluster di grafemi.