What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Prevodník textu ↔ Unicode

Režim

Formát

Text

Unicode

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Technické podrobnosti

Ako funguje prevodník Text ↔ Unicode

Čo nástroj robí

Nástroj Text ↔ Unicode prevádza text na a z Unicode kódových bodov vo viacerých zápisoch: U+XXXX, JavaScript escape sekvencie (\uXXXX alebo \u{XXXXX}), desiatkový zápis, 0xHEX a číselné HTML entity (&#N; alebo &#xHEX;). Dekodér je tolerantný — rozpozná ľubovoľnú kombináciu týchto zápisov premiešanú s textom a extrahuje kódové body. Enkodér vám umožní zvoliť výstupný formát a oddeľovač medzi kódovými bodmi.

Bežné prípady použitia pre vývojárov

Frontend vývojári používajú tento nástroj na preklad emoji a CJK znakov do bezpečných ASCII escape sekvencií pre JSON súbory, zdrojový kód alebo prenos cez obmedzujúce kanály. Lokalizační inžinieri overujú presné kódové body použité v preloženom reťazci. Nástroj je užitočný aj na odhaľovanie neviditeľných alebo podobne vyzerajúcich znakov (homoglyfy, zero-width joinery, RTL značky) skrytých v skopírovanom úryvku.

Dátové formáty, typy alebo varianty

Štandardný zápis Unicode je U+XXXX pre Basic Multilingual Plane a U+XXXXX pre doplnkové roviny. JavaScript escape sekvencie používajú \uXXXX pre BMP a \u{XXXXX} (ES2015+) pre celý rozsah. HTML akceptuje číselné entity (desiatkové &#N; alebo hex &#xN;). Čistý desiatkový a 0xHEX formát sa dajú bez straty previesť cez codePointAt / fromCodePoint bez ďalšej interpretácie. Astrálne znaky (emoji ako 🌍) sú reprezentované ako jeden kódový bod nad U+FFFF.

Bežné úskalia a okrajové prípady

Astrálne znaky nie je možné vyjadriť staršou formou \uXXXX, pretože každý escape má iba 4 hex číslice — použite \u{...} alebo surrogate pair. Kódové body nad U+10FFFF sú podľa špecifikácie Unicode neplatné a budú odmietnuté. Kombinačné znamienka a emoji ZWJ sekvencie sa zobrazujú ako viac kódových bodov, aj keď sa vykreslia ako jeden glyf. Dekodér nebude interpretovať pomenované HTML entity (©, &) — na tie použite samostatný HTML dekodér.

Kedy použiť tento nástroj vs. kód

Použite nástroj v prehliadači na rýchlu kontrolu, generovanie escape sekvencií a hľadanie homoglyfov. V kóde uprednostnite natívne API pre reťazce v danom jazyku (`String.fromCodePoint`, `Array.from(str)` na iteráciu po kódových bodoch v JS; `chr` a `ord` v Pythone; `Character.toCodePoint` v Jave) a plné ICU knižnice, keď potrebujete normalizáciu (NFC/NFD), case folding alebo segmentáciu grapheme clusterov.