Penukar Teks ↔ Unicode
Teks
Unicode
Butiran teknikal
Cara Penukar Teks ↔ Unicode Berfungsi
Apa yang Alat Ini Lakukan
Alat Teks ↔ Unicode menukar teks kepada dan daripada titik kod Unicode dalam pelbagai notasi: U+XXXX, escape JavaScript (\uXXXX atau \u{XXXXX}), perpuluhan, 0xHEX, dan entiti berangka HTML (&#N; atau &#xHEX;). Penyahkod adalah permisif — ia mengenal pasti sebarang gabungan notasi ini yang diselang-selikan dengan teks dan mengekstrak titik kod. Pengekod membolehkan anda memilih format output dan pemisah antara titik kod.
Kes Penggunaan Pembangun yang Lazim
Pembangun frontend menggunakan alat ini untuk menterjemah emoji dan aksara CJK kepada jujukan escape ASCII yang selamat untuk fail JSON, kod sumber, atau penghantaran melalui saluran yang ketat. Jurutera penyetempatan mengesahkan titik kod tepat yang digunakan dalam rentetan terjemahan. Alat ini juga berguna untuk mengesan aksara halimunan atau yang kelihatan serupa (homoglif, penyambung lebar sifar, tanda RTL) yang tersembunyi dalam petikan yang disalin.
Format Data, Jenis, atau Varian
Notasi standard Unicode ialah U+XXXX untuk Basic Multilingual Plane dan U+XXXXX untuk satah tambahan. Escape JavaScript menggunakan \uXXXX untuk BMP dan \u{XXXXX} (ES2015+) untuk julat penuh. HTML menerima entiti berangka (perpuluhan &#N; atau heks &#xN;). Format perpuluhan biasa dan 0xHEX boleh pergi-balik melalui codePointAt / fromCodePoint tanpa tafsiran lanjut. Aksara astral (emoji seperti 🌍) diwakili sebagai satu titik kod di atas U+FFFF.
Perangkap Lazim dan Kes Tepi
Aksara astral tidak boleh dinyatakan dengan bentuk \uXXXX yang lebih lama kerana setiap escape hanya 4 digit heks — gunakan \u{...} atau pasangan surrogate. Titik kod melebihi U+10FFFF adalah tidak sah mengikut spesifikasi Unicode dan akan ditolak. Tanda gabungan dan jujukan ZWJ emoji muncul sebagai berbilang titik kod walaupun ia dirender sebagai satu glif. Penyahkod tidak akan mentafsir entiti bernama HTML (©, &) — gunakan penyahkod HTML khusus untuk itu.
Bila Perlu Menggunakan Alat Ini Berbanding Kod
Gunakan alat pelayar untuk pemeriksaan pantas, penjanaan jujukan escape, dan pemburuan homoglif. Dalam kod, utamakan API rentetan natif bahasa (`String.fromCodePoint`, `Array.from(str)` untuk iterasi titik kod dalam JS; `chr` dan `ord` dalam Python; `Character.toCodePoint` dalam Java) serta pustaka ICU penuh apabila anda memerlukan penormalan (NFC/NFD), case folding, atau segmentasi kluster grafem.