DevToys Web Pro iconDevToys Web ProBlog
Ocijenite nas:
Isprobajte proširenje preglednika:

Pretvarač Tekst ↔ Unicode

Način
Format

Tekst

  • Unicode

  • Tehnički detalji

    Kako radi pretvarač Tekst ↔ Unicode

    Što alat radi

    Alat Tekst ↔ Unicode pretvara tekst u Unicode kodne točke i iz njih u više zapisa: U+XXXX, JavaScript escape sekvence (\uXXXX ili \u{XXXXX}), decimalno, 0xHEX i HTML numeričke entitete (&#N; ili &#xHEX;). Dekoder je tolerantan — prepoznaje bilo koju kombinaciju tih zapisa isprepletenu s tekstom i izdvaja kodne točke. Enkoder vam omogućuje odabir izlaznog formata i razdjelnika između kodnih točaka.

    Uobičajeni slučajevi upotrebe za razvojne programere

    Frontend razvojni inženjeri koriste alat za pretvaranje emojija i CJK znakova u sigurne ASCII escape sekvence za JSON datoteke, izvorni kod ili prijenos preko restriktivnih kanala. Inženjeri lokalizacije provjeravaju točne kodne točke korištene u prevedenom nizu. Alat je također koristan za otkrivanje nevidljivih ili sličnih znakova (homoglifi, spojnici nulte širine, RTL oznake) skrivenih u kopiranom isječku.

    Formati podataka, vrste ili varijante

    Standardna Unicode notacija je U+XXXX za Osnovnu višejezičnu ravninu (BMP) i U+XXXXX za dopunske ravnine. JavaScript escape sekvence koriste \uXXXX za BMP i \u{XXXXX} (ES2015+) za cijeli raspon. HTML prihvaća numeričke entitete (decimalno &#N; ili heksadekadski &#xN;). Obični decimalni i 0xHEX formati prolaze round-trip kroz codePointAt / fromCodePoint bez dodatne interpretacije. Astralni znakovi (emoji poput 🌍) predstavljeni su kao jedna kodna točka iznad U+FFFF.

    Uobičajene zamke i rubni slučajevi

    Astralni znakovi ne mogu se izraziti starijim oblikom \uXXXX jer svaka escape sekvenca ima samo 4 heksadekadske znamenke — koristite \u{...} ili surogatni par. Kodne točke iznad U+10FFFF nevažeće su prema Unicode specifikaciji i bit će odbijene. Kombinirajuće oznake i emoji ZWJ sekvence pojavljuju se kao više kodnih točaka iako se prikazuju kao jedan glif. Dekoder neće interpretirati HTML imenovane entitete (©, &) — za to koristite namjenski HTML dekoder.

    Kada koristiti ovaj alat umjesto koda

    Koristite alat u pregledniku za brzu provjeru, generiranje escape sekvenci i lov na homoglifie. U kodu preferirajte izvorne API-je jezika za rad s nizovima (`String.fromCodePoint`, `Array.from(str)` za iteraciju po kodnim točkama u JS-u; `chr` i `ord` u Pythonu; `Character.toCodePoint` u Javi) te pune ICU biblioteke kada trebate normalizaciju (NFC/NFD), presavijanje velikih/malih slova (case folding) ili segmentaciju grafemskih klastera.