Konvertor Tekst ↔ Unicode
Tekst
Unicode
Tehnički detalji
Kako radi konvertor Tekst ↔ Unicode
Šta alat radi
Alat Tekst ↔ Unicode konvertuje tekst u Unicode kodne tačke i iz njih u više notacija: U+XXXX, JavaScript escape sekvence (\uXXXX ili \u{XXXXX}), decimalno, 0xHEX i HTML numeričke entitete (&#N; ili &#xHEX;). Dekoder je tolerantan — prepoznaje bilo koju kombinaciju ovih notacija pomešanu sa tekstom i izdvaja kodne tačke. Enkoder vam omogućava da izaberete izlazni format i separator između kodnih tačaka.
Uobičajeni slučajevi upotrebe za programere
Frontend programeri koriste alat da prevedu emodžije i CJK znakove u bezbedne ASCII escape sekvence za JSON fajlove, izvorni kod ili prenos preko restriktivnih kanala. Inženjeri za lokalizaciju proveravaju tačne kodne tačke korišćene u prevedenom stringu. Alat je takođe koristan za uočavanje nevidljivih ili sličnih znakova (homoglifi, spajači nulte širine, RTL oznake) koji se kriju u kopiranom isečku.
Formati podataka, tipovi ili varijante
Standardna Unicode notacija je U+XXXX za Osnovnu višejezičnu ravan i U+XXXXX za dopunske ravni. JavaScript escape sekvence koriste \uXXXX za BMP i \u{XXXXX} (ES2015+) za ceo opseg. HTML prihvata numeričke entitete (decimalno &#N; ili heks &#xN;). Obični decimalni i 0xHEX formati se mogu round-trip-ovati kroz codePointAt / fromCodePoint bez dodatnog tumačenja. Astralni znakovi (emodžiji poput 🌍) predstavljeni su kao jedna kodna tačka iznad U+FFFF.
Uobičajene greške i rubni slučajevi
Astralni znakovi ne mogu da se izraze starijim oblikom \uXXXX jer svaki escape ima samo 4 heks cifre — koristite \u{...} ili surogatni par. Kodne tačke iznad U+10FFFF su nevažeće prema Unicode specifikaciji i biće odbijene. Kombinujuće oznake i emodži ZWJ sekvence pojavljuju se kao više kodnih tačaka iako se renderuju kao jedan glif. Dekoder neće tumačiti HTML imenovane entitete (©, &) — za to koristite namenski HTML dekoder.
Kada koristiti ovaj alat umesto koda
Koristite alat u pregledaču za brzu inspekciju, generisanje escape sekvenci i lov na homoglife. U kodu, dajte prednost nativnim API-jima za stringove (`String.fromCodePoint`, `Array.from(str)` za iteraciju po kodnim tačkama u JS; `chr` i `ord` u Python-u; `Character.toCodePoint` u Javi) uz pune ICU biblioteke kada vam treba normalizacija (NFC/NFD), presavijanje veličine slova (case folding) ili segmentacija grafemskih klastera.