What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Convertidor de texto ↔ Unicode

Modo

Formato

Texto

Unicode

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Detalles técnicos

Cómo funciona el convertidor de texto ↔ Unicode

Qué hace la herramienta

La herramienta Texto ↔ Unicode convierte texto hacia y desde puntos de código Unicode en múltiples notaciones: U+XXXX, escapes de JavaScript (\uXXXX o \u{XXXXX}), decimal, 0xHEX y entidades numéricas HTML (&#N; o &#xHEX;). El decodificador es permisivo: reconoce cualquier combinación de estas notaciones intercaladas con texto y extrae los puntos de código. El codificador te permite elegir el formato de salida y un separador entre puntos de código.

Casos de uso comunes para desarrolladores

Los desarrolladores frontend usan la herramienta para traducir emojis y caracteres CJK a secuencias de escape ASCII seguras para archivos JSON, código fuente o transporte por canales restrictivos. Los ingenieros de localización verifican los puntos de código exactos usados en una cadena traducida. La herramienta también es útil para detectar caracteres invisibles o parecidos (homoglifos, uniones de ancho cero, marcas RTL) ocultos dentro de un fragmento copiado.

Formatos, tipos o variantes de datos

La notación estándar de Unicode es U+XXXX para el Plano Multilingüe Básico y U+XXXXX para planos suplementarios. Los escapes de JavaScript usan \uXXXX para BMP y \u{XXXXX} (ES2015+) para el rango completo. HTML acepta entidades numéricas (decimal &#N; o hex &#xN;). Los formatos decimal simple y 0xHEX hacen round-trip mediante codePointAt / fromCodePoint sin interpretación adicional. Los caracteres astrales (emojis como 🌍) se representan como un solo punto de código por encima de U+FFFF.

Errores comunes y casos límite

Los caracteres astrales no se pueden expresar con la forma antigua \uXXXX porque cada escape tiene solo 4 dígitos hex: usa \u{...} o un par sustituto. Los puntos de código por encima de U+10FFFF son inválidos según la especificación de Unicode y se rechazarán. Las marcas combinantes y las secuencias de emojis con ZWJ aparecen como múltiples puntos de código aunque se rendericen como un solo glifo. El decodificador no interpretará entidades con nombre de HTML (©, &): usa un decodificador HTML dedicado para esas.

Cuándo usar esta herramienta vs código

Usa la herramienta del navegador para inspección rápida, generación de secuencias de escape y búsqueda de homoglifos. En código, prefiere las APIs nativas del lenguaje para cadenas (`String.fromCodePoint`, `Array.from(str)` para iteración por puntos de código en JS; `chr` y `ord` en Python; `Character.toCodePoint` en Java) además de bibliotecas ICU completas cuando necesites normalización (NFC/NFD), case folding o segmentación por clústeres de grafemas.