Convertidor de text ↔ Unicode
Text
Unicode
Detalls tècnics
Com funciona el convertidor de text ↔ Unicode
Què fa l’eina
L'eina Text ↔ Unicode converteix text cap a i des de punts de codi Unicode en múltiples notacions: U+XXXX, escapaments de JavaScript (\uXXXX o \u{XXXXX}), decimal, 0xHEX i entitats numèriques HTML (&#N; o &#xHEX;). El descodificador és permissiu: reconeix qualsevol combinació d'aquestes notacions intercalades amb text i n'extreu els punts de codi. El codificador et permet triar el format de sortida i un separador entre punts de codi.
Casos d’ús habituals per a desenvolupadors
Els desenvolupadors frontend utilitzen l'eina per traduir emoji i caràcters CJK a seqüències d'escapament ASCII segures per a fitxers JSON, codi font o transport a través de canals restrictius. Els enginyers de localització verifiquen els punts de codi exactes utilitzats en una cadena traduïda. L'eina també és útil per detectar caràcters invisibles o semblants (homòglifs, zero-width joiners, marques RTL) amagats dins d'un fragment copiat.
Formats, tipus o variants de dades
La notació estàndard d'Unicode és U+XXXX per al Pla Multilingüe Bàsic i U+XXXXX per als plans suplementaris. Els escapaments de JavaScript utilitzen \uXXXX per al BMP i \u{XXXXX} (ES2015+) per a tot el rang. HTML accepta entitats numèriques (decimal &#N; o hexadecimal &#xN;). Els formats decimal pla i 0xHEX fan un recorregut d'anada i tornada mitjançant codePointAt / fromCodePoint sense més interpretació. Els caràcters astrals (emoji com 🌍) es representen com un únic punt de codi per sobre de U+FFFF.
Errors habituals i casos límit
Els caràcters astrals no es poden expressar amb la forma antiga \uXXXX perquè cada escapament només té 4 dígits hexadecimals — fes servir \u{...} o un parell substitut. Els punts de codi per sobre de U+10FFFF són invàlids segons l'especificació Unicode i es rebutjaran. Les marques combinatòries i les seqüències d'emoji amb ZWJ apareixen com múltiples punts de codi tot i que es renderitzen com un sol glif. El descodificador no interpretarà entitats HTML amb nom (©, &) — per a això, fes servir un descodificador HTML dedicat.
Quan utilitzar aquesta eina vs codi
Utilitza l'eina del navegador per a una inspecció ràpida, generació de seqüències d'escapament i caça d'homòglifs. En codi, prefereix les API natives de cadenes del llenguatge (`String.fromCodePoint`, `Array.from(str)` per iterar per punts de codi en JS; `chr` i `ord` en Python; `Character.toCodePoint` en Java) i biblioteques ICU completes quan necessitis normalització (NFC/NFD), case folding o segmentació de clústers de grafemes.