What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Converter ng Teksto ↔ Unicode

Mode

Format

Teksto

Unicode

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Mga teknikal na detalye

Paano Gumagana ang Text ↔ Unicode Converter

Ano ang Ginagawa ng Tool

Kinokonvert ng Text ↔ Unicode tool ang text papunta at mula sa Unicode code points sa maraming notasyon: U+XXXX, JavaScript escapes (\uXXXX o \u{XXXXX}), decimal, 0xHEX, at HTML numeric entities (&#N; o &#xHEX;). Maluwag ang decoder — kinikilala nito ang anumang kombinasyon ng mga notasyong ito na nahahalo sa text at kinukuha ang mga code point. Pinapahintulutan ka ng encoder na piliin ang output format at ang separator sa pagitan ng mga code point.

Mga Karaniwang Gamit ng Developer

Ginagamit ng mga frontend developer ang tool para isalin ang emoji at mga CJK character sa ligtas na ASCII escape sequences para sa mga JSON file, source code, o pagpapadala sa mga restriktibong channel. Tinitiyak ng mga localization engineer ang eksaktong mga code point na ginamit sa isang isinaling string. Kapaki-pakinabang din ang tool para matukoy ang mga hindi nakikitang o kahawig na character (homoglyphs, zero-width joiners, RTL marks) na nakatago sa loob ng isang kinopyang snippet.

Mga Format, Uri, o Variant ng Data

Ang pamantayang notasyon ng Unicode ay U+XXXX para sa Basic Multilingual Plane at U+XXXXX para sa mga supplementary plane. Gumagamit ang JavaScript escapes ng \uXXXX para sa BMP at \u{XXXXX} (ES2015+) para sa buong saklaw. Tumatanggap ang HTML ng numeric entities (decimal &#N; o hex &#xN;). Ang plain decimal at 0xHEX na mga format ay nagra-round-trip sa codePointAt / fromCodePoint nang walang karagdagang interpretasyon. Ang mga astral character (mga emoji tulad ng 🌍) ay kinakatawan bilang iisang code point na mas mataas sa U+FFFF.

Mga Karaniwang Pagkakamali at Edge Case

Hindi maipapahayag ang mga astral character gamit ang mas lumang \uXXXX na anyo dahil 4 na hex digit lang ang bawat escape — gamitin ang \u{...} o isang surrogate pair. Ang mga code point na mas mataas sa U+10FFFF ay hindi wasto ayon sa Unicode spec at tatanggihan. Lumalabas ang combining marks at mga emoji ZWJ sequence bilang maraming code point kahit na nagre-render ang mga ito bilang iisang glyph. Hindi i-interpret ng decoder ang HTML named entities (©, &) — gumamit ng nakalaang HTML decoder para sa mga iyon.

Kailan Gagamitin ang Tool na Ito kumpara sa Code

Gamitin ang browser tool para sa mabilisang inspeksyon, pagbuo ng escape-sequence, at paghahanap ng homoglyph. Sa code, mas mainam ang mga language-native string API (`String.fromCodePoint`, `Array.from(str)` para sa code-point iteration sa JS; `chr` at `ord` sa Python; `Character.toCodePoint` sa Java) kasama ang buong ICU libraries kapag kailangan mo ng normalization (NFC/NFD), case folding, o grapheme-cluster segmentation.