DevToys Web Pro iconDevToys Web ProBlog
Bewerten Sie uns:
Browser-Erweiterung ausprobieren:

Text ↔ Unicode-Konverter

Modus
Format

Text

  • Unicode

  • Technische Details

    Wie der Text-↔-Unicode-Konverter funktioniert

    Was das Tool macht

    Das Text-↔-Unicode-Tool konvertiert Text in Unicode-Codepoints und zurück, in mehreren Notationen: U+XXXX, JavaScript-Escapes (\uXXXX oder \u{XXXXX}), dezimal, 0xHEX und HTML-numerische Entities (&#N; oder &#xHEX;). Der Decoder ist tolerant — er erkennt beliebige Kombinationen dieser Notationen, die mit Text vermischt sind, und extrahiert die Codepoints. Der Encoder lässt dich das Ausgabeformat und ein Trennzeichen zwischen Codepoints wählen.

    Häufige Anwendungsfälle für Entwickler

    Frontend-Entwickler nutzen das Tool, um Emojis und CJK-Zeichen in sichere ASCII-Escape-Sequenzen für JSON-Dateien, Quellcode oder den Transport über restriktive Kanäle zu übersetzen. Lokalisierungsingenieure prüfen die exakten Codepoints, die in einem übersetzten String verwendet werden. Das Tool ist außerdem hilfreich, um unsichtbare oder ähnlich aussehende Zeichen (Homoglyphen, Zero-Width-Joiner, RTL-Markierungen) zu entdecken, die sich in einem kopierten Snippet verstecken.

    Datenformate, Typen oder Varianten

    Die Unicode-Standardnotation ist U+XXXX für die Basic Multilingual Plane und U+XXXXX für ergänzende Ebenen. JavaScript-Escapes verwenden \uXXXX für BMP und \u{XXXXX} (ES2015+) für den gesamten Bereich. HTML akzeptiert numerische Entities (dezimal &#N; oder hex &#xN;). Reine Dezimal- und 0xHEX-Formate lassen sich über codePointAt / fromCodePoint ohne weitere Interpretation verlustfrei hin und zurück konvertieren. Astrale Zeichen (Emojis wie 🌍) werden als einzelner Codepoint oberhalb von U+FFFF dargestellt.

    Häufige Fallstricke und Sonderfälle

    Astrale Zeichen können nicht mit der älteren \uXXXX-Form ausgedrückt werden, weil jedes Escape nur 4 Hex-Ziffern hat — verwende \u{...} oder ein Surrogatpaar. Codepoints oberhalb von U+10FFFF sind gemäß Unicode-Spezifikation ungültig und werden abgelehnt. Kombinierende Zeichen und Emoji-ZWJ-Sequenzen erscheinen als mehrere Codepoints, auch wenn sie als einzelnes Glyph gerendert werden. Der Decoder interpretiert keine benannten HTML-Entities (©, &) — verwende dafür einen dedizierten HTML-Decoder.

    Wann dieses Tool statt Code verwenden

    Nutze das Browser-Tool für schnelle Inspektion, das Erzeugen von Escape-Sequenzen und die Homoglyphen-Suche. Im Code solltest du bevorzugt sprach-native String-APIs verwenden (`String.fromCodePoint`, `Array.from(str)` für Codepoint-Iteration in JS; `chr` und `ord` in Python; `Character.toCodePoint` in Java) sowie vollständige ICU-Bibliotheken, wenn du Normalisierung (NFC/NFD), Case Folding oder Grapheme-Cluster-Segmentierung benötigst.