Convertitore Testo ↔ Unicode
Testo
Unicode
Dettagli tecnici
Come funziona il convertitore Testo ↔ Unicode
Cosa fa lo strumento
Lo strumento Testo ↔ Unicode converte il testo da e verso i punti di codice Unicode in più notazioni: U+XXXX, escape JavaScript (\uXXXX o \u{XXXXX}), decimale, 0xHEX e entità numeriche HTML (&#N; o &#xHEX;). Il decoder è permissivo: riconosce qualsiasi combinazione di queste notazioni intervallate da testo ed estrae i punti di codice. L'encoder ti consente di scegliere il formato di output e un separatore tra i punti di codice.
Casi d’uso comuni per sviluppatori
Gli sviluppatori frontend usano lo strumento per tradurre emoji e caratteri CJK in sequenze di escape ASCII sicure per file JSON, codice sorgente o trasporto su canali restrittivi. Gli ingegneri di localizzazione verificano i punti di codice esatti usati in una stringa tradotta. Lo strumento è utile anche per individuare caratteri invisibili o simili (omoglifi, zero-width joiner, marcatori RTL) nascosti dentro uno snippet copiato.
Formati, tipi o varianti dei dati
La notazione standard Unicode è U+XXXX per il Basic Multilingual Plane e U+XXXXX per i piani supplementari. Gli escape JavaScript usano \uXXXX per il BMP e \u{XXXXX} (ES2015+) per l'intero intervallo. HTML accetta entità numeriche (decimali &#N; o esadecimali &#xN;). I formati decimale semplice e 0xHEX fanno round-trip tramite codePointAt / fromCodePoint senza ulteriori interpretazioni. I caratteri astrali (emoji come 🌍) sono rappresentati come un singolo punto di codice sopra U+FFFF.
Errori comuni e casi limite
I caratteri astrali non possono essere espressi con la vecchia forma \uXXXX perché ogni escape è di sole 4 cifre esadecimali: usa \u{...} o una coppia surrogata. I punti di codice sopra U+10FFFF non sono validi secondo la specifica Unicode e verranno rifiutati. I segni diacritici combinanti e le sequenze emoji ZWJ appaiono come più punti di codice anche se vengono renderizzati come un singolo glifo. Il decoder non interpreterà le entità HTML con nome (©, &): per quelle usa un decoder HTML dedicato.
Quando usare questo strumento rispetto al codice
Usa lo strumento nel browser per un'ispezione rapida, la generazione di sequenze di escape e la caccia agli omoglifi. Nel codice, preferisci le API native del linguaggio per le stringhe (`String.fromCodePoint`, `Array.from(str)` per l'iterazione per punto di codice in JS; `chr` e `ord` in Python; `Character.toCodePoint` in Java) più librerie ICU complete quando ti servono normalizzazione (NFC/NFD), case folding o segmentazione in cluster di grafemi.