Kigeuzi cha Maandishi ↔ Unicode
Maandishi
Unicode
Maelezo ya kiufundi
Jinsi Kigeuzi cha Maandishi ↔ Unicode Kinavyofanya Kazi
Zana Hii Hufanya Nini
Zana ya Maandishi ↔ Unicode hubadilisha maandishi kwenda na kutoka kwenye pointi za msimbo za Unicode katika miandiko mbalimbali: U+XXXX, JavaScript escapes (\uXXXX au \u{XXXXX}), desimali, 0xHEX, na vitambulisho vya nambari vya HTML (&#N; au &#xHEX;). Kifasiri (decoder) ni chenye kuruhusu — hutambua mchanganyiko wowote wa miandiko hii iliyochanganywa na maandishi na kutoa pointi za msimbo. Kifasiri (encoder) hukuruhusu kuchagua umbizo la matokeo na kitenganishi kati ya pointi za msimbo.
Matumizi ya Kawaida kwa Wasanidi
Watengenezaji wa frontend hutumia zana hii kutafsiri emoji na herufi za CJK kuwa mfuatano salama wa ASCII wa escape kwa faili za JSON, msimbo wa chanzo, au usafirishaji kupitia njia zenye vizuizi. Wahandisi wa ujanibishaji (localization) hukagua pointi halisi za msimbo zinazotumika kwenye tungo iliyotafsiriwa. Zana hii pia husaidia kugundua herufi zisizoonekana au zinazofanana (homoglyphs, zero-width joiners, alama za RTL) zilizojificha ndani ya kipande kilichonakiliwa.
Miundo ya Data, Aina, au Lahaja
Uandishi wa kawaida wa Unicode ni U+XXXX kwa Basic Multilingual Plane na U+XXXXX kwa supplementary planes. JavaScript escapes hutumia \uXXXX kwa BMP na \u{XXXXX} (ES2015+) kwa wigo mzima. HTML hukubali vitambulisho vya nambari (desimali &#N; au heksi &#xN;). Miundo ya desimali ya kawaida na 0xHEX hurudi (round-trip) kupitia codePointAt / fromCodePoint bila tafsiri ya ziada. Herufi za astral (emoji kama 🌍) huwakilishwa kama pointi moja ya msimbo iliyo juu ya U+FFFF.
Mitego ya Kawaida na Matukio ya Pembeni
Herufi za astral haziwezi kuonyeshwa kwa umbo la zamani \uXXXX kwa sababu kila escape ni tarakimu 4 tu za heksi — tumia \u{...} au jozi ya surrogate. Pointi za msimbo zilizo juu ya U+10FFFF si halali kulingana na vipimo vya Unicode na zitakataliwa. Alama za kuunganisha (combining marks) na mfuatano wa emoji ZWJ huonekana kama pointi nyingi za msimbo ingawa huonekana kama glifu moja. Kifasiri (decoder) hakitatafsiri vitambulisho vya HTML vilivyo na majina (©, &) — tumia decoder maalum ya HTML kwa hivyo.
Wakati wa Kutumia Zana Hii dhidi ya Msimbo
Tumia zana ya kivinjari kwa ukaguzi wa haraka, kutengeneza mfuatano wa escape, na kuwinda homoglyph. Kwenye msimbo, pendelea API za tungo za lugha husika (`String.fromCodePoint`, `Array.from(str)` kwa iteresheni ya pointi za msimbo katika JS; `chr` na `ord` katika Python; `Character.toCodePoint` katika Java) pamoja na maktaba kamili za ICU unapohitaji urekebishaji (NFC/NFD), case folding, au ugawaji wa grapheme-cluster.