DevToys Web Pro iconDevToys Web ProБлог
Ocenite nas:
Isprobajte ekstenziju za pregledač:

Konvertor Tekst ↔ Unicode

Režim
Формат

Tekst

  • Unicode

  • Tehnički detalji

    Kako radi konvertor Tekst ↔ Unicode

    Šta alat radi

    Alat Tekst ↔ Unicode konvertuje tekst u Unicode kodne tačke i iz njih u više notacija: U+XXXX, JavaScript escape sekvence (\uXXXX ili \u{XXXXX}), decimalno, 0xHEX i HTML numeričke entitete (&#N; ili &#xHEX;). Dekoder je tolerantan — prepoznaje bilo koju kombinaciju ovih notacija pomešanu sa tekstom i izdvaja kodne tačke. Enkoder vam omogućava da izaberete izlazni format i separator između kodnih tačaka.

    Uobičajeni slučajevi upotrebe za programere

    Frontend programeri koriste alat da prevedu emodžije i CJK znakove u bezbedne ASCII escape sekvence za JSON fajlove, izvorni kod ili prenos preko restriktivnih kanala. Inženjeri za lokalizaciju proveravaju tačne kodne tačke korišćene u prevedenom stringu. Alat je takođe koristan za uočavanje nevidljivih ili sličnih znakova (homoglifi, spajači nulte širine, RTL oznake) koji se kriju u kopiranom isečku.

    Formati podataka, tipovi ili varijante

    Standardna Unicode notacija je U+XXXX za Osnovnu višejezičnu ravan i U+XXXXX za dopunske ravni. JavaScript escape sekvence koriste \uXXXX za BMP i \u{XXXXX} (ES2015+) za ceo opseg. HTML prihvata numeričke entitete (decimalno &#N; ili heks &#xN;). Obični decimalni i 0xHEX formati se mogu round-trip-ovati kroz codePointAt / fromCodePoint bez dodatnog tumačenja. Astralni znakovi (emodžiji poput 🌍) predstavljeni su kao jedna kodna tačka iznad U+FFFF.

    Uobičajene greške i rubni slučajevi

    Astralni znakovi ne mogu da se izraze starijim oblikom \uXXXX jer svaki escape ima samo 4 heks cifre — koristite \u{...} ili surogatni par. Kodne tačke iznad U+10FFFF su nevažeće prema Unicode specifikaciji i biće odbijene. Kombinujuće oznake i emodži ZWJ sekvence pojavljuju se kao više kodnih tačaka iako se renderuju kao jedan glif. Dekoder neće tumačiti HTML imenovane entitete (©, &) — za to koristite namenski HTML dekoder.

    Kada koristiti ovaj alat umesto koda

    Koristite alat u pregledaču za brzu inspekciju, generisanje escape sekvenci i lov na homoglife. U kodu, dajte prednost nativnim API-jima za stringove (`String.fromCodePoint`, `Array.from(str)` za iteraciju po kodnim tačkama u JS; `chr` i `ord` u Python-u; `Character.toCodePoint` u Javi) uz pune ICU biblioteke kada vam treba normalizacija (NFC/NFD), presavijanje veličine slova (case folding) ili segmentacija grafemskih klastera.