DevToys Web Pro iconDevToys Web ProBlog
Evaluează-ne:
Încearcă extensia de browser:

Convertor Text ↔ Unicode

Mod
Format

Text

  • Unicode

  • Detalii tehnice

    Cum funcționează convertorul Text ↔ Unicode

    Ce face instrumentul

    Instrumentul Text ↔ Unicode convertește textul către și din puncte de cod Unicode în mai multe notații: U+XXXX, escape-uri JavaScript (\uXXXX sau \u{XXXXX}), zecimal, 0xHEX și entități numerice HTML (&#N; sau &#xHEX;). Decodorul este permisiv — recunoaște orice combinație a acestor notații intercalate cu text și extrage punctele de cod. Codorul îți permite să alegi formatul de ieșire și un separator între punctele de cod.

    Cazuri de utilizare comune pentru dezvoltatori

    Dezvoltatorii frontend folosesc instrumentul pentru a traduce emoji și caractere CJK în secvențe de escape ASCII sigure pentru fișiere JSON, cod sursă sau transport prin canale restrictive. Inginerii de localizare verifică punctele de cod exacte folosite într-un șir tradus. Instrumentul este util și pentru a depista caractere invizibile sau asemănătoare (homoglife, joineri cu lățime zero, marcaje RTL) ascunse într-un fragment copiat.

    Formate de date, tipuri sau variante

    Notația standard Unicode este U+XXXX pentru Basic Multilingual Plane și U+XXXXX pentru planurile suplimentare. Escape-urile JavaScript folosesc \uXXXX pentru BMP și \u{XXXXX} (ES2015+) pentru întregul interval. HTML acceptă entități numerice (zecimal &#N; sau hex &#xN;). Formatele zecimal simplu și 0xHEX fac round-trip prin codePointAt / fromCodePoint fără interpretare suplimentară. Caracterele astrale (emoji precum 🌍) sunt reprezentate ca un singur punct de cod peste U+FFFF.

    Capcane frecvente și cazuri limită

    Caracterele astrale nu pot fi exprimate cu forma mai veche \uXXXX deoarece fiecare escape are doar 4 cifre hex — folosește \u{...} sau o pereche de surogate. Punctele de cod peste U+10FFFF sunt invalide conform specificației Unicode și vor fi respinse. Semnele de combinare și secvențele emoji ZWJ apar ca mai multe puncte de cod chiar dacă se redau ca un singur glif. Decodorul nu va interpreta entitățile HTML denumite (©, &) — folosește un decodor HTML dedicat pentru acestea.

    Când să folosești acest instrument vs cod

    Folosește instrumentul din browser pentru inspecție rapidă, generarea de secvențe de escape și vânătoare de homoglife. În cod, preferă API-urile native ale limbajului pentru șiruri (`String.fromCodePoint`, `Array.from(str)` pentru iterarea pe puncte de cod în JS; `chr` și `ord` în Python; `Character.toCodePoint` în Java) plus biblioteci ICU complete când ai nevoie de normalizare (NFC/NFD), case folding sau segmentare pe clustere de grafeme.