Converter ng Teksto ↔ Unicode
Teksto
Unicode
Mga teknikal na detalye
Paano Gumagana ang Text ↔ Unicode Converter
Ano ang Ginagawa ng Tool
Kinokonvert ng Text ↔ Unicode tool ang text papunta at mula sa Unicode code points sa maraming notasyon: U+XXXX, JavaScript escapes (\uXXXX o \u{XXXXX}), decimal, 0xHEX, at HTML numeric entities (&#N; o &#xHEX;). Maluwag ang decoder — kinikilala nito ang anumang kombinasyon ng mga notasyong ito na nahahalo sa text at kinukuha ang mga code point. Pinapahintulutan ka ng encoder na piliin ang output format at ang separator sa pagitan ng mga code point.
Mga Karaniwang Gamit ng Developer
Ginagamit ng mga frontend developer ang tool para isalin ang emoji at mga CJK character sa ligtas na ASCII escape sequences para sa mga JSON file, source code, o pagpapadala sa mga restriktibong channel. Tinitiyak ng mga localization engineer ang eksaktong mga code point na ginamit sa isang isinaling string. Kapaki-pakinabang din ang tool para matukoy ang mga hindi nakikitang o kahawig na character (homoglyphs, zero-width joiners, RTL marks) na nakatago sa loob ng isang kinopyang snippet.
Mga Format, Uri, o Variant ng Data
Ang pamantayang notasyon ng Unicode ay U+XXXX para sa Basic Multilingual Plane at U+XXXXX para sa mga supplementary plane. Gumagamit ang JavaScript escapes ng \uXXXX para sa BMP at \u{XXXXX} (ES2015+) para sa buong saklaw. Tumatanggap ang HTML ng numeric entities (decimal &#N; o hex &#xN;). Ang plain decimal at 0xHEX na mga format ay nagra-round-trip sa codePointAt / fromCodePoint nang walang karagdagang interpretasyon. Ang mga astral character (mga emoji tulad ng 🌍) ay kinakatawan bilang iisang code point na mas mataas sa U+FFFF.
Mga Karaniwang Pagkakamali at Edge Case
Hindi maipapahayag ang mga astral character gamit ang mas lumang \uXXXX na anyo dahil 4 na hex digit lang ang bawat escape — gamitin ang \u{...} o isang surrogate pair. Ang mga code point na mas mataas sa U+10FFFF ay hindi wasto ayon sa Unicode spec at tatanggihan. Lumalabas ang combining marks at mga emoji ZWJ sequence bilang maraming code point kahit na nagre-render ang mga ito bilang iisang glyph. Hindi i-interpret ng decoder ang HTML named entities (©, &) — gumamit ng nakalaang HTML decoder para sa mga iyon.
Kailan Gagamitin ang Tool na Ito kumpara sa Code
Gamitin ang browser tool para sa mabilisang inspeksyon, pagbuo ng escape-sequence, at paghahanap ng homoglyph. Sa code, mas mainam ang mga language-native string API (`String.fromCodePoint`, `Array.from(str)` para sa code-point iteration sa JS; `chr` at `ord` sa Python; `Character.toCodePoint` sa Java) kasama ang buong ICU libraries kapag kailangan mo ng normalization (NFC/NFD), case folding, o grapheme-cluster segmentation.