ടെക്സ്റ്റ് ↔ Unicode പരിവർത്തകൻ
ടെക്സ്റ്റ്
യൂണിക്കോഡ്
സാങ്കേതിക വിശദാംശങ്ങൾ
ടെക്സ്റ്റ് ↔ യൂണിക്കോഡ് കൺവേർട്ടർ എങ്ങനെ പ്രവർത്തിക്കുന്നു
ഉപകരണം ചെയ്യുന്നത് എന്താണ്
ടെക്സ്റ്റ് ↔ യൂണിക്കോഡ് ടൂൾ ടെക്സ്റ്റിനെ വിവിധ നോട്ടേഷനുകളിലുള്ള യൂണിക്കോഡ് കോഡ് പോയിന്റുകളിലേക്കും അവയിൽ നിന്ന് തിരിച്ചും മാറ്റുന്നു: U+XXXX, JavaScript escapes (\uXXXX or \u{XXXXX}), decimal, 0xHEX, കൂടാതെ HTML numeric entities (&#N; or &#xHEX;). ഡീകോഡർ ലളിതമാണ് — ടെക്സ്റ്റിനിടയിൽ കലർന്നിരിക്കുന്ന ഈ നോട്ടേഷനുകളുടെ ഏതൊരു സംയോജനവും തിരിച്ചറിഞ്ഞ് കോഡ് പോയിന്റുകൾ പുറത്തെടുക്കും. എൻകോഡർ ഔട്ട്പുട്ട് ഫോർമാറ്റും കോഡ് പോയിന്റുകൾക്കിടയിലെ സെപ്പറേറ്ററും തിരഞ്ഞെടുക്കാൻ അനുവദിക്കുന്നു.
ഡെവലപ്പർമാർക്കുള്ള സാധാരണ ഉപയോഗ സാഹചര്യങ്ങൾ
ഫ്രണ്ട്എൻഡ് ഡെവലപ്പർമാർ JSON ഫയലുകൾ, സോഴ്സ് കോഡ്, അല്ലെങ്കിൽ നിയന്ത്രിത ചാനലുകളിലൂടെയുള്ള ട്രാൻസ്പോർട്ട് എന്നിവയ്ക്കായി ഇമോജിയും CJK അക്ഷരങ്ങളും സുരക്ഷിതമായ ASCII escape സീക്വൻസുകളാക്കി മാറ്റാൻ ഈ ടൂൾ ഉപയോഗിക്കുന്നു. ലോക്കലൈസേഷൻ എഞ്ചിനീയർമാർ വിവർത്തനം ചെയ്ത സ്ട്രിംഗിൽ ഉപയോഗിച്ചിരിക്കുന്ന കൃത്യമായ കോഡ് പോയിന്റുകൾ പരിശോധിക്കുന്നു. കോപ്പി ചെയ്ത ഒരു സ്നിപ്പറ്റിനുള്ളിൽ മറഞ്ഞിരിക്കുന്ന അദൃശ്യമായ അല്ലെങ്കിൽ ഒരുപോലെ തോന്നുന്ന അക്ഷരങ്ങൾ (homoglyphs, zero-width joiners, RTL marks) കണ്ടെത്താനും ഈ ടൂൾ സഹായകരമാണ്.
ഡാറ്റ ഫോർമാറ്റുകൾ, തരങ്ങൾ, അല്ലെങ്കിൽ വകഭേദങ്ങൾ
യൂണിക്കോഡ് സ്റ്റാൻഡേർഡ് നോട്ടേഷൻ Basic Multilingual Plane-നായി U+XXXX ഉം supplementary planes-നായി U+XXXXX ഉം ആണ്. JavaScript escapes BMP-ക്കായി \uXXXX ഉം പൂർണ്ണ ശ്രേണിക്കായി \u{XXXXX} (ES2015+) ഉം ഉപയോഗിക്കുന്നു. HTML numeric entities (decimal &#N; അല്ലെങ്കിൽ hex &#xN;) സ്വീകരിക്കുന്നു. Plain decimal ഉം 0xHEX ഫോർമാറ്റുകളും അധിക വ്യാഖ്യാനം ഇല്ലാതെ codePointAt / fromCodePoint വഴി round-trip ചെയ്യുന്നു. Astral characters (🌍 പോലുള്ള ഇമോജി) U+FFFF-നു മുകളിലുള്ള ഒരു ഒറ്റ കോഡ് പോയിന്റായി പ്രതിനിധീകരിക്കപ്പെടുന്നു.
സാധാരണ പിഴവുകളും എഡ്ജ് കേസുകളും
Astral characters പഴയ \uXXXX രൂപത്തിൽ പ്രകടിപ്പിക്കാൻ കഴിയില്ല, കാരണം ഓരോ escape-ഉം 4 hex അക്കങ്ങൾ മാത്രമാണ് — \u{...} അല്ലെങ്കിൽ ഒരു surrogate pair ഉപയോഗിക്കുക. U+10FFFF-നു മുകളിലുള്ള കോഡ് പോയിന്റുകൾ യൂണിക്കോഡ് സ്പെക് പ്രകാരം അസാധുവാണ്, അതിനാൽ നിരസിക്കും. Combining marks ഉം emoji ZWJ സീക്വൻസുകളും ഒരൊറ്റ glyph ആയി റെൻഡർ ചെയ്താലും ഒന്നിലധികം കോഡ് പോയിന്റുകളായി പ്രത്യക്ഷപ്പെടും. ഡീകോഡർ HTML named entities (©, &) വ്യാഖ്യാനിക്കില്ല — അവയ്ക്കായി പ്രത്യേക HTML ഡീകോഡർ ഉപയോഗിക്കുക.
കോഡിനേക്കാൾ ഈ ഉപകരണം എപ്പോൾ ഉപയോഗിക്കണം
വേഗത്തിലുള്ള ഇൻസ്പെക്ഷൻ, escape-sequence ജനറേഷൻ, homoglyph hunting എന്നിവയ്ക്കായി ബ്രൗസർ ടൂൾ ഉപയോഗിക്കുക. കോഡിൽ, ഭാഷയിലെ നേറ്റീവ് സ്ട്രിംഗ് APIകൾ (`String.fromCodePoint`, JS-ൽ code-point iteration-നായി `Array.from(str)`; Python-ൽ `chr`യും `ord`യും; Java-യിൽ `Character.toCodePoint`) കൂടാതെ normalization (NFC/NFD), case folding, അല്ലെങ്കിൽ grapheme-cluster segmentation ആവശ്യമായപ്പോൾ പൂർണ്ണ ICU ലൈബ്രറികളും മുൻഗണിക്കുക.