DevToys Web Pro iconDevToys Web ProBlog
I-rate kami:
Subukan ang browser extension:

Converter ng Teksto ↔ Unicode

Mode
Format

Teksto

  • Unicode

  • Mga teknikal na detalye

    Paano Gumagana ang Text ↔ Unicode Converter

    Ano ang Ginagawa ng Tool

    Kinokonvert ng Text ↔ Unicode tool ang text papunta at mula sa Unicode code points sa maraming notasyon: U+XXXX, JavaScript escapes (\uXXXX o \u{XXXXX}), decimal, 0xHEX, at HTML numeric entities (&#N; o &#xHEX;). Maluwag ang decoder — kinikilala nito ang anumang kombinasyon ng mga notasyong ito na nahahalo sa text at kinukuha ang mga code point. Pinapahintulutan ka ng encoder na piliin ang output format at ang separator sa pagitan ng mga code point.

    Mga Karaniwang Gamit ng Developer

    Ginagamit ng mga frontend developer ang tool para isalin ang emoji at mga CJK character sa ligtas na ASCII escape sequences para sa mga JSON file, source code, o pagpapadala sa mga restriktibong channel. Tinitiyak ng mga localization engineer ang eksaktong mga code point na ginamit sa isang isinaling string. Kapaki-pakinabang din ang tool para matukoy ang mga hindi nakikitang o kahawig na character (homoglyphs, zero-width joiners, RTL marks) na nakatago sa loob ng isang kinopyang snippet.

    Mga Format, Uri, o Variant ng Data

    Ang pamantayang notasyon ng Unicode ay U+XXXX para sa Basic Multilingual Plane at U+XXXXX para sa mga supplementary plane. Gumagamit ang JavaScript escapes ng \uXXXX para sa BMP at \u{XXXXX} (ES2015+) para sa buong saklaw. Tumatanggap ang HTML ng numeric entities (decimal &#N; o hex &#xN;). Ang plain decimal at 0xHEX na mga format ay nagra-round-trip sa codePointAt / fromCodePoint nang walang karagdagang interpretasyon. Ang mga astral character (mga emoji tulad ng 🌍) ay kinakatawan bilang iisang code point na mas mataas sa U+FFFF.

    Mga Karaniwang Pagkakamali at Edge Case

    Hindi maipapahayag ang mga astral character gamit ang mas lumang \uXXXX na anyo dahil 4 na hex digit lang ang bawat escape — gamitin ang \u{...} o isang surrogate pair. Ang mga code point na mas mataas sa U+10FFFF ay hindi wasto ayon sa Unicode spec at tatanggihan. Lumalabas ang combining marks at mga emoji ZWJ sequence bilang maraming code point kahit na nagre-render ang mga ito bilang iisang glyph. Hindi i-interpret ng decoder ang HTML named entities (©, &) — gumamit ng nakalaang HTML decoder para sa mga iyon.

    Kailan Gagamitin ang Tool na Ito kumpara sa Code

    Gamitin ang browser tool para sa mabilisang inspeksyon, pagbuo ng escape-sequence, at paghahanap ng homoglyph. Sa code, mas mainam ang mga language-native string API (`String.fromCodePoint`, `Array.from(str)` para sa code-point iteration sa JS; `chr` at `ord` sa Python; `Character.toCodePoint` sa Java) kasama ang buong ICU libraries kapag kailangan mo ng normalization (NFC/NFD), case folding, o grapheme-cluster segmentation.