Tekst ↔ Unicode-converter
Tekst
Unicode
Technische details
Hoe de Tekst ↔ Unicode-converter werkt
Wat de tool doet
De Tekst ↔ Unicode-tool zet tekst om naar en van Unicode-codepoints in meerdere notaties: U+XXXX, JavaScript-escapes (\uXXXX of \u{XXXXX}), decimaal, 0xHEX en HTML-numerieke entiteiten (&#N; of &#xHEX;). De decoder is tolerant — hij herkent elke combinatie van deze notaties, door elkaar met tekst, en extraheert de codepoints. Met de encoder kun je het uitvoerformaat kiezen en een scheidingsteken tussen codepoints instellen.
Veelvoorkomende use-cases voor ontwikkelaars
Frontendontwikkelaars gebruiken de tool om emoji en CJK-tekens te vertalen naar veilige ASCII-escape-sequenties voor JSON-bestanden, broncode of transport via beperkende kanalen. Lokalisatie-engineers controleren de exacte codepoints die in een vertaalde string zijn gebruikt. De tool is ook handig om onzichtbare of op elkaar lijkende tekens (homoglyfen, zero-width joiners, RTL-markeringen) te vinden die in een gekopieerd fragment verborgen zitten.
Gegevensformaten, typen of varianten
De standaard Unicode-notatie is U+XXXX voor het Basic Multilingual Plane en U+XXXXX voor aanvullende planes. JavaScript-escapes gebruiken \uXXXX voor BMP en \u{XXXXX} (ES2015+) voor het volledige bereik. HTML accepteert numerieke entiteiten (decimaal &#N; of hex &#xN;). Gewone decimale en 0xHEX-formaten round-trippen via codePointAt / fromCodePoint zonder verdere interpretatie. Astrale tekens (emoji zoals 🌍) worden weergegeven als één codepoint boven U+FFFF.
Veelvoorkomende valkuilen en edge-cases
Astrale tekens kunnen niet worden uitgedrukt met de oudere \uXXXX-vorm, omdat elke escape slechts 4 hex-cijfers heeft — gebruik \u{...} of een surrogaatpaar. Codepoints boven U+10FFFF zijn ongeldig volgens de Unicode-specificatie en worden geweigerd. Combinatietekens en emoji-ZWJ-sequenties verschijnen als meerdere codepoints, ook al renderen ze als één glyph. De decoder interpreteert geen HTML-benamde entiteiten (©, &) — gebruik daarvoor een speciale HTML-decoder.
Wanneer je deze tool gebruikt vs code
Gebruik de browsertool voor snelle inspectie, het genereren van escape-sequenties en het opsporen van homoglyfen. In code kun je beter de taal-eigen string-API's gebruiken (`String.fromCodePoint`, `Array.from(str)` voor codepoint-iteratie in JS; `chr` en `ord` in Python; `Character.toCodePoint` in Java) plus volledige ICU-bibliotheken wanneer je normalisatie (NFC/NFD), case folding of segmentatie in grapheme clusters nodig hebt.