What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

ടെക്സ്റ്റ് ↔ Unicode പരിവർത്തകൻ

മോഡ്

ഫോർമാറ്റ്

ടെക്സ്റ്റ്

യൂണിക്കോഡ്

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

സാങ്കേതിക വിശദാംശങ്ങൾ

ടെക്സ്റ്റ് ↔ യൂണിക്കോഡ് കൺവേർട്ടർ എങ്ങനെ പ്രവർത്തിക്കുന്നു

ഉപകരണം ചെയ്യുന്നത് എന്താണ്

ടെക്സ്റ്റ് ↔ യൂണിക്കോഡ് ടൂൾ ടെക്സ്റ്റിനെ വിവിധ നോട്ടേഷനുകളിലുള്ള യൂണിക്കോഡ് കോഡ് പോയിന്റുകളിലേക്കും അവയിൽ നിന്ന് തിരിച്ചും മാറ്റുന്നു: U+XXXX, JavaScript escapes (\uXXXX or \u{XXXXX}), decimal, 0xHEX, കൂടാതെ HTML numeric entities (&#N; or &#xHEX;). ഡീകോഡർ ലളിതമാണ് — ടെക്സ്റ്റിനിടയിൽ കലർന്നിരിക്കുന്ന ഈ നോട്ടേഷനുകളുടെ ഏതൊരു സംയോജനവും തിരിച്ചറിഞ്ഞ് കോഡ് പോയിന്റുകൾ പുറത്തെടുക്കും. എൻകോഡർ ഔട്ട്‌പുട്ട് ഫോർമാറ്റും കോഡ് പോയിന്റുകൾക്കിടയിലെ സെപ്പറേറ്ററും തിരഞ്ഞെടുക്കാൻ അനുവദിക്കുന്നു.

ഡെവലപ്പർമാർക്കുള്ള സാധാരണ ഉപയോഗ സാഹചര്യങ്ങൾ

ഫ്രണ്ട്‌എൻഡ് ഡെവലപ്പർമാർ JSON ഫയലുകൾ, സോഴ്‌സ് കോഡ്, അല്ലെങ്കിൽ നിയന്ത്രിത ചാനലുകളിലൂടെയുള്ള ട്രാൻസ്‌പോർട്ട് എന്നിവയ്ക്കായി ഇമോജിയും CJK അക്ഷരങ്ങളും സുരക്ഷിതമായ ASCII escape സീക്വൻസുകളാക്കി മാറ്റാൻ ഈ ടൂൾ ഉപയോഗിക്കുന്നു. ലോക്കലൈസേഷൻ എഞ്ചിനീയർമാർ വിവർത്തനം ചെയ്ത സ്ട്രിംഗിൽ ഉപയോഗിച്ചിരിക്കുന്ന കൃത്യമായ കോഡ് പോയിന്റുകൾ പരിശോധിക്കുന്നു. കോപ്പി ചെയ്ത ഒരു സ്നിപ്പറ്റിനുള്ളിൽ മറഞ്ഞിരിക്കുന്ന അദൃശ്യമായ അല്ലെങ്കിൽ ഒരുപോലെ തോന്നുന്ന അക്ഷരങ്ങൾ (homoglyphs, zero-width joiners, RTL marks) കണ്ടെത്താനും ഈ ടൂൾ സഹായകരമാണ്.

ഡാറ്റ ഫോർമാറ്റുകൾ, തരങ്ങൾ, അല്ലെങ്കിൽ വകഭേദങ്ങൾ

യൂണിക്കോഡ് സ്റ്റാൻഡേർഡ് നോട്ടേഷൻ Basic Multilingual Plane-നായി U+XXXX ഉം supplementary planes-നായി U+XXXXX ഉം ആണ്. JavaScript escapes BMP-ക്കായി \uXXXX ഉം പൂർണ്ണ ശ്രേണിക്കായി \u{XXXXX} (ES2015+) ഉം ഉപയോഗിക്കുന്നു. HTML numeric entities (decimal &#N; അല്ലെങ്കിൽ hex &#xN;) സ്വീകരിക്കുന്നു. Plain decimal ഉം 0xHEX ഫോർമാറ്റുകളും അധിക വ്യാഖ്യാനം ഇല്ലാതെ codePointAt / fromCodePoint വഴി round-trip ചെയ്യുന്നു. Astral characters (🌍 പോലുള്ള ഇമോജി) U+FFFF-നു മുകളിലുള്ള ഒരു ഒറ്റ കോഡ് പോയിന്റായി പ്രതിനിധീകരിക്കപ്പെടുന്നു.

സാധാരണ പിഴവുകളും എഡ്ജ് കേസുകളും

Astral characters പഴയ \uXXXX രൂപത്തിൽ പ്രകടിപ്പിക്കാൻ കഴിയില്ല, കാരണം ഓരോ escape-ഉം 4 hex അക്കങ്ങൾ മാത്രമാണ് — \u{...} അല്ലെങ്കിൽ ഒരു surrogate pair ഉപയോഗിക്കുക. U+10FFFF-നു മുകളിലുള്ള കോഡ് പോയിന്റുകൾ യൂണിക്കോഡ് സ്പെക് പ്രകാരം അസാധുവാണ്, അതിനാൽ നിരസിക്കും. Combining marks ഉം emoji ZWJ സീക്വൻസുകളും ഒരൊറ്റ glyph ആയി റെൻഡർ ചെയ്താലും ഒന്നിലധികം കോഡ് പോയിന്റുകളായി പ്രത്യക്ഷപ്പെടും. ഡീകോഡർ HTML named entities (©, &) വ്യാഖ്യാനിക്കില്ല — അവയ്ക്കായി പ്രത്യേക HTML ഡീകോഡർ ഉപയോഗിക്കുക.

കോഡിനേക്കാൾ ഈ ഉപകരണം എപ്പോൾ ഉപയോഗിക്കണം

വേഗത്തിലുള്ള ഇൻസ്പെക്ഷൻ, escape-sequence ജനറേഷൻ, homoglyph hunting എന്നിവയ്ക്കായി ബ്രൗസർ ടൂൾ ഉപയോഗിക്കുക. കോഡിൽ, ഭാഷയിലെ നേറ്റീവ് സ്ട്രിംഗ് APIകൾ (`String.fromCodePoint`, JS-ൽ code-point iteration-നായി `Array.from(str)`; Python-ൽ `chr`യും `ord`യും; Java-യിൽ `Character.toCodePoint`) കൂടാതെ normalization (NFC/NFD), case folding, അല്ലെങ്കിൽ grapheme-cluster segmentation ആവശ്യമായപ്പോൾ പൂർണ്ണ ICU ലൈബ്രറികളും മുൻഗണിക്കുക.