Text ↔ Unicode-Konverter
Text
Unicode
Technische Details
Wie der Text-↔-Unicode-Konverter funktioniert
Was das Tool macht
Das Text-↔-Unicode-Tool konvertiert Text in Unicode-Codepoints und zurück, in mehreren Notationen: U+XXXX, JavaScript-Escapes (\uXXXX oder \u{XXXXX}), dezimal, 0xHEX und HTML-numerische Entities (&#N; oder &#xHEX;). Der Decoder ist tolerant — er erkennt beliebige Kombinationen dieser Notationen, die mit Text vermischt sind, und extrahiert die Codepoints. Der Encoder lässt dich das Ausgabeformat und ein Trennzeichen zwischen Codepoints wählen.
Häufige Anwendungsfälle für Entwickler
Frontend-Entwickler nutzen das Tool, um Emojis und CJK-Zeichen in sichere ASCII-Escape-Sequenzen für JSON-Dateien, Quellcode oder den Transport über restriktive Kanäle zu übersetzen. Lokalisierungsingenieure prüfen die exakten Codepoints, die in einem übersetzten String verwendet werden. Das Tool ist außerdem hilfreich, um unsichtbare oder ähnlich aussehende Zeichen (Homoglyphen, Zero-Width-Joiner, RTL-Markierungen) zu entdecken, die sich in einem kopierten Snippet verstecken.
Datenformate, Typen oder Varianten
Die Unicode-Standardnotation ist U+XXXX für die Basic Multilingual Plane und U+XXXXX für ergänzende Ebenen. JavaScript-Escapes verwenden \uXXXX für BMP und \u{XXXXX} (ES2015+) für den gesamten Bereich. HTML akzeptiert numerische Entities (dezimal &#N; oder hex &#xN;). Reine Dezimal- und 0xHEX-Formate lassen sich über codePointAt / fromCodePoint ohne weitere Interpretation verlustfrei hin und zurück konvertieren. Astrale Zeichen (Emojis wie 🌍) werden als einzelner Codepoint oberhalb von U+FFFF dargestellt.
Häufige Fallstricke und Sonderfälle
Astrale Zeichen können nicht mit der älteren \uXXXX-Form ausgedrückt werden, weil jedes Escape nur 4 Hex-Ziffern hat — verwende \u{...} oder ein Surrogatpaar. Codepoints oberhalb von U+10FFFF sind gemäß Unicode-Spezifikation ungültig und werden abgelehnt. Kombinierende Zeichen und Emoji-ZWJ-Sequenzen erscheinen als mehrere Codepoints, auch wenn sie als einzelnes Glyph gerendert werden. Der Decoder interpretiert keine benannten HTML-Entities (©, &) — verwende dafür einen dedizierten HTML-Decoder.
Wann dieses Tool statt Code verwenden
Nutze das Browser-Tool für schnelle Inspektion, das Erzeugen von Escape-Sequenzen und die Homoglyphen-Suche. Im Code solltest du bevorzugt sprach-native String-APIs verwenden (`String.fromCodePoint`, `Array.from(str)` für Codepoint-Iteration in JS; `chr` und `ord` in Python; `Character.toCodePoint` in Java) sowie vollständige ICU-Bibliotheken, wenn du Normalisierung (NFC/NFD), Case Folding oder Grapheme-Cluster-Segmentierung benötigst.