What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Konvertor Tekst ↔ Unicode

Režim

Формат

Tekst

Unicode

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Tehnički detalji

Kako radi konvertor Tekst ↔ Unicode

Šta alat radi

Alat Tekst ↔ Unicode konvertuje tekst u Unicode kodne tačke i iz njih u više notacija: U+XXXX, JavaScript escape sekvence (\uXXXX ili \u{XXXXX}), decimalno, 0xHEX i HTML numeričke entitete (&#N; ili &#xHEX;). Dekoder je tolerantan — prepoznaje bilo koju kombinaciju ovih notacija pomešanu sa tekstom i izdvaja kodne tačke. Enkoder vam omogućava da izaberete izlazni format i separator između kodnih tačaka.

Uobičajeni slučajevi upotrebe za programere

Frontend programeri koriste alat da prevedu emodžije i CJK znakove u bezbedne ASCII escape sekvence za JSON fajlove, izvorni kod ili prenos preko restriktivnih kanala. Inženjeri za lokalizaciju proveravaju tačne kodne tačke korišćene u prevedenom stringu. Alat je takođe koristan za uočavanje nevidljivih ili sličnih znakova (homoglifi, spajači nulte širine, RTL oznake) koji se kriju u kopiranom isečku.

Formati podataka, tipovi ili varijante

Standardna Unicode notacija je U+XXXX za Osnovnu višejezičnu ravan i U+XXXXX za dopunske ravni. JavaScript escape sekvence koriste \uXXXX za BMP i \u{XXXXX} (ES2015+) za ceo opseg. HTML prihvata numeričke entitete (decimalno &#N; ili heks &#xN;). Obični decimalni i 0xHEX formati se mogu round-trip-ovati kroz codePointAt / fromCodePoint bez dodatnog tumačenja. Astralni znakovi (emodžiji poput 🌍) predstavljeni su kao jedna kodna tačka iznad U+FFFF.

Uobičajene greške i rubni slučajevi

Astralni znakovi ne mogu da se izraze starijim oblikom \uXXXX jer svaki escape ima samo 4 heks cifre — koristite \u{...} ili surogatni par. Kodne tačke iznad U+10FFFF su nevažeće prema Unicode specifikaciji i biće odbijene. Kombinujuće oznake i emodži ZWJ sekvence pojavljuju se kao više kodnih tačaka iako se renderuju kao jedan glif. Dekoder neće tumačiti HTML imenovane entitete (©, &) — za to koristite namenski HTML dekoder.

Kada koristiti ovaj alat umesto koda

Koristite alat u pregledaču za brzu inspekciju, generisanje escape sekvenci i lov na homoglife. U kodu, dajte prednost nativnim API-jima za stringove (`String.fromCodePoint`, `Array.from(str)` za iteraciju po kodnim tačkama u JS; `chr` i `ord` u Python-u; `Character.toCodePoint` u Javi) uz pune ICU biblioteke kada vam treba normalizacija (NFC/NFD), presavijanje veličine slova (case folding) ili segmentacija grafemskih klastera.