Convertor Text ↔ Unicode
Text
Unicode
Detalii tehnice
Cum funcționează convertorul Text ↔ Unicode
Ce face instrumentul
Instrumentul Text ↔ Unicode convertește textul către și din puncte de cod Unicode în mai multe notații: U+XXXX, escape-uri JavaScript (\uXXXX sau \u{XXXXX}), zecimal, 0xHEX și entități numerice HTML (&#N; sau &#xHEX;). Decodorul este permisiv — recunoaște orice combinație a acestor notații intercalate cu text și extrage punctele de cod. Codorul îți permite să alegi formatul de ieșire și un separator între punctele de cod.
Cazuri de utilizare comune pentru dezvoltatori
Dezvoltatorii frontend folosesc instrumentul pentru a traduce emoji și caractere CJK în secvențe de escape ASCII sigure pentru fișiere JSON, cod sursă sau transport prin canale restrictive. Inginerii de localizare verifică punctele de cod exacte folosite într-un șir tradus. Instrumentul este util și pentru a depista caractere invizibile sau asemănătoare (homoglife, joineri cu lățime zero, marcaje RTL) ascunse într-un fragment copiat.
Formate de date, tipuri sau variante
Notația standard Unicode este U+XXXX pentru Basic Multilingual Plane și U+XXXXX pentru planurile suplimentare. Escape-urile JavaScript folosesc \uXXXX pentru BMP și \u{XXXXX} (ES2015+) pentru întregul interval. HTML acceptă entități numerice (zecimal &#N; sau hex &#xN;). Formatele zecimal simplu și 0xHEX fac round-trip prin codePointAt / fromCodePoint fără interpretare suplimentară. Caracterele astrale (emoji precum 🌍) sunt reprezentate ca un singur punct de cod peste U+FFFF.
Capcane frecvente și cazuri limită
Caracterele astrale nu pot fi exprimate cu forma mai veche \uXXXX deoarece fiecare escape are doar 4 cifre hex — folosește \u{...} sau o pereche de surogate. Punctele de cod peste U+10FFFF sunt invalide conform specificației Unicode și vor fi respinse. Semnele de combinare și secvențele emoji ZWJ apar ca mai multe puncte de cod chiar dacă se redau ca un singur glif. Decodorul nu va interpreta entitățile HTML denumite (©, &) — folosește un decodor HTML dedicat pentru acestea.
Când să folosești acest instrument vs cod
Folosește instrumentul din browser pentru inspecție rapidă, generarea de secvențe de escape și vânătoare de homoglife. În cod, preferă API-urile native ale limbajului pentru șiruri (`String.fromCodePoint`, `Array.from(str)` pentru iterarea pe puncte de cod în JS; `chr` și `ord` în Python; `Character.toCodePoint` în Java) plus biblioteci ICU complete când ai nevoie de normalizare (NFC/NFD), case folding sau segmentare pe clustere de grafeme.