DevToys Web Pro iconDevToys Web ProBlog
Valora'ns:
Prova l'extensió del navegador:

Convertidor de text ↔ Unicode

Mode
Format

Text

  • Unicode

  • Detalls tècnics

    Com funciona el convertidor de text ↔ Unicode

    Què fa l’eina

    L'eina Text ↔ Unicode converteix text cap a i des de punts de codi Unicode en múltiples notacions: U+XXXX, escapaments de JavaScript (\uXXXX o \u{XXXXX}), decimal, 0xHEX i entitats numèriques HTML (&#N; o &#xHEX;). El descodificador és permissiu: reconeix qualsevol combinació d'aquestes notacions intercalades amb text i n'extreu els punts de codi. El codificador et permet triar el format de sortida i un separador entre punts de codi.

    Casos d’ús habituals per a desenvolupadors

    Els desenvolupadors frontend utilitzen l'eina per traduir emoji i caràcters CJK a seqüències d'escapament ASCII segures per a fitxers JSON, codi font o transport a través de canals restrictius. Els enginyers de localització verifiquen els punts de codi exactes utilitzats en una cadena traduïda. L'eina també és útil per detectar caràcters invisibles o semblants (homòglifs, zero-width joiners, marques RTL) amagats dins d'un fragment copiat.

    Formats, tipus o variants de dades

    La notació estàndard d'Unicode és U+XXXX per al Pla Multilingüe Bàsic i U+XXXXX per als plans suplementaris. Els escapaments de JavaScript utilitzen \uXXXX per al BMP i \u{XXXXX} (ES2015+) per a tot el rang. HTML accepta entitats numèriques (decimal &#N; o hexadecimal &#xN;). Els formats decimal pla i 0xHEX fan un recorregut d'anada i tornada mitjançant codePointAt / fromCodePoint sense més interpretació. Els caràcters astrals (emoji com 🌍) es representen com un únic punt de codi per sobre de U+FFFF.

    Errors habituals i casos límit

    Els caràcters astrals no es poden expressar amb la forma antiga \uXXXX perquè cada escapament només té 4 dígits hexadecimals — fes servir \u{...} o un parell substitut. Els punts de codi per sobre de U+10FFFF són invàlids segons l'especificació Unicode i es rebutjaran. Les marques combinatòries i les seqüències d'emoji amb ZWJ apareixen com múltiples punts de codi tot i que es renderitzen com un sol glif. El descodificador no interpretarà entitats HTML amb nom (©, &) — per a això, fes servir un descodificador HTML dedicat.

    Quan utilitzar aquesta eina vs codi

    Utilitza l'eina del navegador per a una inspecció ràpida, generació de seqüències d'escapament i caça d'homòglifs. En codi, prefereix les API natives de cadenes del llenguatge (`String.fromCodePoint`, `Array.from(str)` per iterar per punts de codi en JS; `chr` i `ord` en Python; `Character.toCodePoint` en Java) i biblioteques ICU completes quan necessitis normalització (NFC/NFD), case folding o segmentació de clústers de grafemes.