What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Text ↔ Unicode-Konverter

Modus

Format

Text

Unicode

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Technische Details

Wie der Text-↔-Unicode-Konverter funktioniert

Was das Tool macht

Das Text-↔-Unicode-Tool konvertiert Text in Unicode-Codepoints und zurück, in mehreren Notationen: U+XXXX, JavaScript-Escapes (\uXXXX oder \u{XXXXX}), dezimal, 0xHEX und HTML-numerische Entities (&#N; oder &#xHEX;). Der Decoder ist tolerant — er erkennt beliebige Kombinationen dieser Notationen, die mit Text vermischt sind, und extrahiert die Codepoints. Der Encoder lässt dich das Ausgabeformat und ein Trennzeichen zwischen Codepoints wählen.

Häufige Anwendungsfälle für Entwickler

Frontend-Entwickler nutzen das Tool, um Emojis und CJK-Zeichen in sichere ASCII-Escape-Sequenzen für JSON-Dateien, Quellcode oder den Transport über restriktive Kanäle zu übersetzen. Lokalisierungsingenieure prüfen die exakten Codepoints, die in einem übersetzten String verwendet werden. Das Tool ist außerdem hilfreich, um unsichtbare oder ähnlich aussehende Zeichen (Homoglyphen, Zero-Width-Joiner, RTL-Markierungen) zu entdecken, die sich in einem kopierten Snippet verstecken.

Datenformate, Typen oder Varianten

Die Unicode-Standardnotation ist U+XXXX für die Basic Multilingual Plane und U+XXXXX für ergänzende Ebenen. JavaScript-Escapes verwenden \uXXXX für BMP und \u{XXXXX} (ES2015+) für den gesamten Bereich. HTML akzeptiert numerische Entities (dezimal &#N; oder hex &#xN;). Reine Dezimal- und 0xHEX-Formate lassen sich über codePointAt / fromCodePoint ohne weitere Interpretation verlustfrei hin und zurück konvertieren. Astrale Zeichen (Emojis wie 🌍) werden als einzelner Codepoint oberhalb von U+FFFF dargestellt.

Häufige Fallstricke und Sonderfälle

Astrale Zeichen können nicht mit der älteren \uXXXX-Form ausgedrückt werden, weil jedes Escape nur 4 Hex-Ziffern hat — verwende \u{...} oder ein Surrogatpaar. Codepoints oberhalb von U+10FFFF sind gemäß Unicode-Spezifikation ungültig und werden abgelehnt. Kombinierende Zeichen und Emoji-ZWJ-Sequenzen erscheinen als mehrere Codepoints, auch wenn sie als einzelnes Glyph gerendert werden. Der Decoder interpretiert keine benannten HTML-Entities (©, &) — verwende dafür einen dedizierten HTML-Decoder.

Wann dieses Tool statt Code verwenden

Nutze das Browser-Tool für schnelle Inspektion, das Erzeugen von Escape-Sequenzen und die Homoglyphen-Suche. Im Code solltest du bevorzugt sprach-native String-APIs verwenden (`String.fromCodePoint`, `Array.from(str)` für Codepoint-Iteration in JS; `chr` und `ord` in Python; `Character.toCodePoint` in Java) sowie vollständige ICU-Bibliotheken, wenn du Normalisierung (NFC/NFD), Case Folding oder Grapheme-Cluster-Segmentierung benötigst.