Szöveg ↔ Unicode átalakító
Szöveg
Unicode
Technikai részletek
Hogyan működik a Szöveg ↔ Unicode konverter
Mit csinál az eszköz
A Szöveg ↔ Unicode eszköz a szöveget Unicode kódpontokká és vissza alakítja többféle jelölésben: U+XXXX, JavaScript escape-ek (\uXXXX vagy \u{XXXXX}), decimális, 0xHEX, valamint HTML numerikus entitások (&#N; vagy &#xHEX;). A dekóder megengedő — felismeri e jelölések bármilyen kombinációját a szöveg közé ékelve, és kinyeri a kódpontokat. Az enkóderben kiválaszthatod a kimeneti formátumot és a kódpontok közötti elválasztót.
Gyakori fejlesztői felhasználási esetek
Frontend fejlesztők az eszközt emojik és CJK karakterek biztonságos ASCII escape-szekvenciákká alakítására használják JSON fájlokhoz, forráskódhoz vagy korlátozó csatornákon történő továbbításhoz. Lokalizációs mérnökök ellenőrzik, hogy egy lefordított sztringben pontosan mely kódpontok szerepelnek. Az eszköz abban is segít, hogy észrevedd a másolt részletben megbújó láthatatlan vagy megtévesztően hasonló karaktereket (homoglifák, zéró szélességű összekötők, RTL jelek).
Adatformátumok, típusok vagy változatok
A Unicode szabványos jelölése U+XXXX az Alap Többnyelvű Sík (BMP) esetén, és U+XXXXX a kiegészítő síkokhoz. A JavaScript escape-ek a BMP-hez \uXXXX-et, a teljes tartományhoz pedig \u{XXXXX} (ES2015+) formát használnak. A HTML numerikus entitásokat fogad el (decimális &#N; vagy hex &#xN;). A sima decimális és a 0xHEX formátumok további értelmezés nélkül körbejárhatók a codePointAt / fromCodePoint segítségével. Az asztrális karakterek (például az 🌍 emoji) egyetlen, U+FFFF feletti kódpontként vannak ábrázolva.
Gyakori buktatók és szélső esetek
Az asztrális karakterek nem fejezhetők ki a régebbi \uXXXX formával, mert minden escape csak 4 hex számjegyből áll — használd a \u{...} formát vagy egy szurrogátpárt. Az U+10FFFF feletti kódpontok érvénytelenek a Unicode specifikáció szerint, és elutasításra kerülnek. Az összetett ékezetek és az emoji ZWJ-szekvenciák több kódpontként jelennek meg, még akkor is, ha egyetlen glifaként renderelődnek. A dekóder nem értelmezi a HTML név szerinti entitásokat (©, &) — ezekhez használj dedikált HTML dekódert.
Mikor érdemes ezt az eszközt használni a kód helyett
Használd a böngészős eszközt gyors ellenőrzéshez, escape-szekvenciák generálásához és homoglifák felkutatásához. Kódban inkább a nyelv natív sztring API-jait részesítsd előnyben (`String.fromCodePoint`, `Array.from(str)` kódpont szerinti iterációhoz JS-ben; `chr` és `ord` Pythonban; `Character.toCodePoint` Javában), valamint teljes ICU könyvtárakat, amikor normalizálásra (NFC/NFD), kis- és nagybetűs egységesítésre (case folding) vagy graféma-klaszter szegmentálásra van szükséged.