Конвертор Текст ↔ Unicode
Текст
Уникод
Технически подробности
Как работи конверторът Текст ↔ Unicode
Какво прави инструментът
Инструментът Текст ↔ Unicode преобразува текст към и от Unicode кодови точки в множество нотации: U+XXXX, JavaScript escape последователности (\uXXXX или \u{XXXXX}), десетична, 0xHEX и HTML числови ентитети (&#N; или &#xHEX;). Декодерът е толерантен — разпознава всякаква комбинация от тези нотации, смесени с текст, и извлича кодовите точки. Енкодерът ви позволява да изберете изходния формат и разделител между кодовите точки.
Често срещани случаи на употреба от разработчици
Frontend разработчиците използват инструмента, за да преобразуват емоджита и CJK символи в безопасни ASCII escape последователности за JSON файлове, изходен код или пренос през ограничителни канали. Инженерите по локализация проверяват точните кодови точки, използвани в преведен низ. Инструментът е полезен и за откриване на невидими или визуално сходни символи (хомоглифи, zero-width joiners, RTL маркери), скрити в копиран фрагмент.
Формати на данни, типове или варианти
Стандартната Unicode нотация е U+XXXX за Basic Multilingual Plane и U+XXXXX за допълнителните равнини. JavaScript escape последователностите използват \uXXXX за BMP и \u{XXXXX} (ES2015+) за целия диапазон. HTML приема числови ентитети (десетични &#N; или шестнадесетични &#xN;). Обикновените десетични и 0xHEX формати се преобразуват двупосочно чрез codePointAt / fromCodePoint без допълнителна интерпретация. Астралните символи (емоджита като 🌍) се представят като единична кодова точка над U+FFFF.
Често срещани капани и гранични случаи
Астралните символи не могат да бъдат изразени със стария формат \uXXXX, защото всяка escape последователност е само 4 шестнадесетични цифри — използвайте \u{...} или сурогатна двойка. Кодови точки над U+10FFFF са невалидни според спецификацията на Unicode и ще бъдат отхвърлени. Комбиниращите знаци и емоджи ZWJ последователностите се появяват като множество кодови точки, въпреки че се визуализират като един глиф. Декодерът няма да интерпретира HTML именувани ентитети (©, &) — за тях използвайте специализиран HTML декодер.
Кога да използвате този инструмент вместо код
Използвайте браузърния инструмент за бърза проверка, генериране на escape последователности и лов на хомоглифи. В код предпочитайте вградените за езика API за низове (`String.fromCodePoint`, `Array.from(str)` за обхождане по кодови точки в JS; `chr` и `ord` в Python; `Character.toCodePoint` в Java) плюс пълни ICU библиотеки, когато ви трябва нормализация (NFC/NFD), case folding или сегментация по графемни клъстери.