DevToys Web Pro iconDevToys Web Pro部落格
為我們評分:
試用瀏覽器擴充功能:

文字 ↔ Unicode 轉換器

模式
格式

文字

  • Unicode

  • 技術細節

    文字 ↔ Unicode 轉換器的運作方式

    工具功能說明

    文字 ↔ Unicode 工具可在多種表示法之間將文字轉換為 Unicode 碼位,並可反向轉換:U+XXXX、JavaScript 跳脫(\uXXXX 或 \u{XXXXX})、十進位、0xHEX,以及 HTML 數字字元實體(&#N; 或 &#xHEX;)。解碼器採寬鬆解析——它會辨識穿插在文字中的任意組合表示法並擷取碼位。編碼器則讓你選擇輸出格式,以及碼位之間的分隔符。

    常見的開發者使用情境

    前端開發者會用此工具把表情符號與中日韓(CJK)字元轉成安全的 ASCII 跳脫序列,用於 JSON 檔案、原始碼,或在受限通道中傳輸。在地化工程師可用它驗證翻譯字串所使用的精確碼位。此工具也有助於找出複製片段中藏著的不可見或外觀相似字元(同形異字、零寬連接符、RTL 標記)。

    資料格式、型別或變體

    Unicode 標準表示法在基本多文種平面使用 U+XXXX,在補充平面使用 U+XXXXX。JavaScript 跳脫在 BMP 使用 \uXXXX,在完整範圍使用 \u{XXXXX}(ES2015+)。HTML 接受數字字元實體(十進位 &#N; 或十六進位 &#xN;)。純十進位與 0xHEX 格式可透過 codePointAt / fromCodePoint 來回轉換而不做額外解讀。星界字元(例如 🌍 這類 emoji)會以高於 U+FFFF 的單一碼位表示。

    常見陷阱與邊界情況

    星界字元無法用較舊的 \uXXXX 形式表示,因為每個跳脫只有 4 位十六進位數——請使用 \u{...} 或代理對(surrogate pair)。高於 U+10FFFF 的碼位依 Unicode 規範屬無效,將被拒絕。組合附加符號與 emoji ZWJ 序列即使渲染為單一字形,仍會呈現為多個碼位。解碼器不會解讀 HTML 命名實體(©、&)——這些請使用專用的 HTML 解碼器。

    何時使用此工具 vs 程式碼

    使用瀏覽器工具可快速檢視、產生跳脫序列,以及進行同形異字排查。在程式碼中,建議優先使用語言原生字串 API(JS 的 `String.fromCodePoint`、用於以碼位迭代的 `Array.from(str)`;Python 的 `chr` 與 `ord`;Java 的 `Character.toCodePoint`),並在需要正規化(NFC/NFD)、大小寫摺疊或字素叢集分割時使用完整的 ICU 函式庫。