Convertidor de texto ↔ Unicode
Texto
Unicode
Detalles técnicos
Cómo funciona el convertidor de texto ↔ Unicode
Qué hace la herramienta
La herramienta Texto ↔ Unicode convierte texto hacia y desde puntos de código Unicode en múltiples notaciones: U+XXXX, escapes de JavaScript (\uXXXX o \u{XXXXX}), decimal, 0xHEX y entidades numéricas HTML (&#N; o &#xHEX;). El decodificador es permisivo: reconoce cualquier combinación de estas notaciones intercaladas con texto y extrae los puntos de código. El codificador te permite elegir el formato de salida y un separador entre puntos de código.
Casos de uso comunes para desarrolladores
Los desarrolladores frontend usan la herramienta para traducir emojis y caracteres CJK a secuencias de escape ASCII seguras para archivos JSON, código fuente o transporte por canales restrictivos. Los ingenieros de localización verifican los puntos de código exactos usados en una cadena traducida. La herramienta también es útil para detectar caracteres invisibles o parecidos (homoglifos, uniones de ancho cero, marcas RTL) ocultos dentro de un fragmento copiado.
Formatos, tipos o variantes de datos
La notación estándar de Unicode es U+XXXX para el Plano Multilingüe Básico y U+XXXXX para planos suplementarios. Los escapes de JavaScript usan \uXXXX para BMP y \u{XXXXX} (ES2015+) para el rango completo. HTML acepta entidades numéricas (decimal &#N; o hex &#xN;). Los formatos decimal simple y 0xHEX hacen round-trip mediante codePointAt / fromCodePoint sin interpretación adicional. Los caracteres astrales (emojis como 🌍) se representan como un solo punto de código por encima de U+FFFF.
Errores comunes y casos límite
Los caracteres astrales no se pueden expresar con la forma antigua \uXXXX porque cada escape tiene solo 4 dígitos hex: usa \u{...} o un par sustituto. Los puntos de código por encima de U+10FFFF son inválidos según la especificación de Unicode y se rechazarán. Las marcas combinantes y las secuencias de emojis con ZWJ aparecen como múltiples puntos de código aunque se rendericen como un solo glifo. El decodificador no interpretará entidades con nombre de HTML (©, &): usa un decodificador HTML dedicado para esas.
Cuándo usar esta herramienta vs código
Usa la herramienta del navegador para inspección rápida, generación de secuencias de escape y búsqueda de homoglifos. En código, prefiere las APIs nativas del lenguaje para cadenas (`String.fromCodePoint`, `Array.from(str)` para iteración por puntos de código en JS; `chr` y `ord` en Python; `Character.toCodePoint` en Java) además de bibliotecas ICU completas cuando necesites normalización (NFC/NFD), case folding o segmentación por clústeres de grafemas.