What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Конвертор Текст ↔ Unicode

Режим

Формат

Текст

Уникод

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Технически подробности

Как работи конверторът Текст ↔ Unicode

Какво прави инструментът

Инструментът Текст ↔ Unicode преобразува текст към и от Unicode кодови точки в множество нотации: U+XXXX, JavaScript escape последователности (\uXXXX или \u{XXXXX}), десетична, 0xHEX и HTML числови ентитети (&#N; или &#xHEX;). Декодерът е толерантен — разпознава всякаква комбинация от тези нотации, смесени с текст, и извлича кодовите точки. Енкодерът ви позволява да изберете изходния формат и разделител между кодовите точки.

Често срещани случаи на употреба от разработчици

Frontend разработчиците използват инструмента, за да преобразуват емоджита и CJK символи в безопасни ASCII escape последователности за JSON файлове, изходен код или пренос през ограничителни канали. Инженерите по локализация проверяват точните кодови точки, използвани в преведен низ. Инструментът е полезен и за откриване на невидими или визуално сходни символи (хомоглифи, zero-width joiners, RTL маркери), скрити в копиран фрагмент.

Формати на данни, типове или варианти

Стандартната Unicode нотация е U+XXXX за Basic Multilingual Plane и U+XXXXX за допълнителните равнини. JavaScript escape последователностите използват \uXXXX за BMP и \u{XXXXX} (ES2015+) за целия диапазон. HTML приема числови ентитети (десетични &#N; или шестнадесетични &#xN;). Обикновените десетични и 0xHEX формати се преобразуват двупосочно чрез codePointAt / fromCodePoint без допълнителна интерпретация. Астралните символи (емоджита като 🌍) се представят като единична кодова точка над U+FFFF.

Често срещани капани и гранични случаи

Астралните символи не могат да бъдат изразени със стария формат \uXXXX, защото всяка escape последователност е само 4 шестнадесетични цифри — използвайте \u{...} или сурогатна двойка. Кодови точки над U+10FFFF са невалидни според спецификацията на Unicode и ще бъдат отхвърлени. Комбиниращите знаци и емоджи ZWJ последователностите се появяват като множество кодови точки, въпреки че се визуализират като един глиф. Декодерът няма да интерпретира HTML именувани ентитети (©, &) — за тях използвайте специализиран HTML декодер.

Кога да използвате този инструмент вместо код

Използвайте браузърния инструмент за бърза проверка, генериране на escape последователности и лов на хомоглифи. В код предпочитайте вградените за езика API за низове (`String.fromCodePoint`, `Array.from(str)` за обхождане по кодови точки в JS; `chr` и `ord` в Python; `Character.toCodePoint` в Java) плюс пълни ICU библиотеки, когато ви трябва нормализация (NFC/NFD), case folding или сегментация по графемни клъстери.