DevToys Web Pro iconDevToys Web ProBlog
Beri nilai kami:
Coba ekstensi browser:

Konverter Teks ↔ Unicode

Mode
Format

Teks

  • Unicode

  • Detail teknis

    Cara Kerja Konverter Teks ↔ Unicode

    Apa yang Dilakukan Alat Ini

    Alat Teks ↔ Unicode mengonversi teks ke dan dari titik kode Unicode dalam berbagai notasi: U+XXXX, escape JavaScript (\uXXXX atau \u{XXXXX}), desimal, 0xHEX, dan entitas numerik HTML (&#N; atau &#xHEX;). Dekoder bersifat permisif — ia mengenali kombinasi apa pun dari notasi-notasi ini yang diselingi teks dan mengekstrak titik kodenya. Enkoder memungkinkan Anda memilih format keluaran dan pemisah antar titik kode.

    Kasus Penggunaan Umum untuk Developer

    Developer frontend menggunakan alat ini untuk menerjemahkan emoji dan karakter CJK menjadi urutan escape ASCII yang aman untuk file JSON, source code, atau pengiriman melalui kanal yang restriktif. Engineer lokalisasi memverifikasi titik kode yang tepat yang digunakan dalam sebuah string terjemahan. Alat ini juga berguna untuk menemukan karakter tak terlihat atau mirip (homoglyph, zero-width joiner, tanda RTL) yang bersembunyi di dalam cuplikan yang disalin.

    Format Data, Tipe, atau Varian

    Notasi standar Unicode adalah U+XXXX untuk Basic Multilingual Plane dan U+XXXXX untuk plane suplementer. Escape JavaScript menggunakan \uXXXX untuk BMP dan \u{XXXXX} (ES2015+) untuk seluruh rentang. HTML menerima entitas numerik (desimal &#N; atau heks &#xN;). Format desimal biasa dan 0xHEX dapat bolak-balik melalui codePointAt / fromCodePoint tanpa interpretasi tambahan. Karakter astral (emoji seperti 🌍) direpresentasikan sebagai satu titik kode di atas U+FFFF.

    Kesalahan Umum dan Kasus Tepi

    Karakter astral tidak dapat diekspresikan dengan bentuk \uXXXX yang lebih lama karena setiap escape hanya 4 digit heks — gunakan \u{...} atau pasangan surrogate. Titik kode di atas U+10FFFF tidak valid menurut spesifikasi Unicode dan akan ditolak. Tanda penggabung dan rangkaian emoji ZWJ muncul sebagai beberapa titik kode meskipun dirender sebagai satu glif. Dekoder tidak akan menafsirkan entitas bernama HTML (©, &) — gunakan dekoder HTML khusus untuk itu.

    Kapan Menggunakan Alat Ini vs Kode

    Gunakan alat browser untuk inspeksi cepat, pembuatan urutan escape, dan berburu homoglyph. Di dalam kode, utamakan API string bawaan bahasa (`String.fromCodePoint`, `Array.from(str)` untuk iterasi per titik kode di JS; `chr` dan `ord` di Python; `Character.toCodePoint` di Java) ditambah library ICU lengkap saat Anda membutuhkan normalisasi (NFC/NFD), case folding, atau segmentasi klaster grafem.