What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Szöveg ↔ Unicode átalakító

Mód

Formátum

Szöveg

Unicode

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Technikai részletek

Hogyan működik a Szöveg ↔ Unicode konverter

Mit csinál az eszköz

A Szöveg ↔ Unicode eszköz a szöveget Unicode kódpontokká és vissza alakítja többféle jelölésben: U+XXXX, JavaScript escape-ek (\uXXXX vagy \u{XXXXX}), decimális, 0xHEX, valamint HTML numerikus entitások (&#N; vagy &#xHEX;). A dekóder megengedő — felismeri e jelölések bármilyen kombinációját a szöveg közé ékelve, és kinyeri a kódpontokat. Az enkóderben kiválaszthatod a kimeneti formátumot és a kódpontok közötti elválasztót.

Gyakori fejlesztői felhasználási esetek

Frontend fejlesztők az eszközt emojik és CJK karakterek biztonságos ASCII escape-szekvenciákká alakítására használják JSON fájlokhoz, forráskódhoz vagy korlátozó csatornákon történő továbbításhoz. Lokalizációs mérnökök ellenőrzik, hogy egy lefordított sztringben pontosan mely kódpontok szerepelnek. Az eszköz abban is segít, hogy észrevedd a másolt részletben megbújó láthatatlan vagy megtévesztően hasonló karaktereket (homoglifák, zéró szélességű összekötők, RTL jelek).

Adatformátumok, típusok vagy változatok

A Unicode szabványos jelölése U+XXXX az Alap Többnyelvű Sík (BMP) esetén, és U+XXXXX a kiegészítő síkokhoz. A JavaScript escape-ek a BMP-hez \uXXXX-et, a teljes tartományhoz pedig \u{XXXXX} (ES2015+) formát használnak. A HTML numerikus entitásokat fogad el (decimális &#N; vagy hex &#xN;). A sima decimális és a 0xHEX formátumok további értelmezés nélkül körbejárhatók a codePointAt / fromCodePoint segítségével. Az asztrális karakterek (például az 🌍 emoji) egyetlen, U+FFFF feletti kódpontként vannak ábrázolva.

Gyakori buktatók és szélső esetek

Az asztrális karakterek nem fejezhetők ki a régebbi \uXXXX formával, mert minden escape csak 4 hex számjegyből áll — használd a \u{...} formát vagy egy szurrogátpárt. Az U+10FFFF feletti kódpontok érvénytelenek a Unicode specifikáció szerint, és elutasításra kerülnek. Az összetett ékezetek és az emoji ZWJ-szekvenciák több kódpontként jelennek meg, még akkor is, ha egyetlen glifaként renderelődnek. A dekóder nem értelmezi a HTML név szerinti entitásokat (©, &) — ezekhez használj dedikált HTML dekódert.

Mikor érdemes ezt az eszközt használni a kód helyett

Használd a böngészős eszközt gyors ellenőrzéshez, escape-szekvenciák generálásához és homoglifák felkutatásához. Kódban inkább a nyelv natív sztring API-jait részesítsd előnyben (`String.fromCodePoint`, `Array.from(str)` kódpont szerinti iterációhoz JS-ben; `chr` és `ord` Pythonban; `Character.toCodePoint` Javában), valamint teljes ICU könyvtárakat, amikor normalizálásra (NFC/NFD), kis- és nagybetűs egységesítésre (case folding) vagy graféma-klaszter szegmentálásra van szükséged.