What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Převodník Text ↔ Unicode

Režim

Formát

Text

Unicode

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Technické detaily

Jak funguje převodník Text ↔ Unicode

Co nástroj dělá

Nástroj Text ↔ Unicode převádí text na a z unicode kódových bodů ve více zápisech: U+XXXX, JavaScriptové escape sekvence (\uXXXX nebo \u{XXXXX}), desítkově, 0xHEX a HTML číselné entity (&#N; nebo &#xHEX;). Dekodér je tolerantní — rozpozná libovolnou kombinaci těchto zápisů proloženou textem a extrahuje kódové body. Enkodér vám umožní zvolit výstupní formát a oddělovač mezi kódovými body.

Běžné případy použití pro vývojáře

Frontend vývojáři nástroj používají k převodu emoji a znaků CJK na bezpečné ASCII escape sekvence pro JSON soubory, zdrojový kód nebo přenos přes restriktivní kanály. Lokalizační inženýři ověřují přesné kódové body použité v přeloženém řetězci. Nástroj je také užitečný pro odhalování neviditelných nebo podobně vypadajících znaků (homoglyfy, spojovníky s nulovou šířkou, značky RTL) schovaných v zkopírovaném úryvku.

Datové formáty, typy nebo varianty

Standardní zápis Unicode je U+XXXX pro základní vícejazyčnou rovinu (BMP) a U+XXXXX pro doplňkové roviny. JavaScriptové escape sekvence používají \uXXXX pro BMP a \u{XXXXX} (ES2015+) pro celý rozsah. HTML přijímá číselné entity (desítkové &#N; nebo hex &#xN;). Prosté desítkové a 0xHEX formáty se dají bezeztrátově převádět přes codePointAt / fromCodePoint bez další interpretace. Astrální znaky (emoji jako 🌍) jsou reprezentovány jako jediný kódový bod nad U+FFFF.

Běžné nástrahy a okrajové případy

Astrální znaky nelze vyjádřit starší formou \uXXXX, protože každá escape sekvence má jen 4 hex číslice — použijte \u{...} nebo surrogate pair. Kódové body nad U+10FFFF jsou podle specifikace Unicode neplatné a budou odmítnuty. Kombinační znaménka a emoji ZWJ sekvence se jeví jako více kódových bodů, i když se vykreslí jako jediný glyf. Dekodér nebude interpretovat pojmenované HTML entity (©, &) — na ty použijte specializovaný HTML dekodér.

Kdy použít tento nástroj vs. kód

Použijte nástroj v prohlížeči pro rychlou kontrolu, generování escape sekvencí a hledání homoglyphů. V kódu upřednostněte nativní string API daného jazyka (`String.fromCodePoint`, `Array.from(str)` pro iteraci po kódových bodech v JS; `chr` a `ord` v Pythonu; `Character.toCodePoint` v Javě) a plné ICU knihovny, když potřebujete normalizaci (NFC/NFD), case folding nebo segmentaci grapheme clusterů.