What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

मजकूर ↔ Unicode रूपांतरक

मोड

स्वरूप

मजकूर

युनिकोड

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

तांत्रिक तपशील

टेक्स्ट ↔ युनिकोड कन्व्हर्टर कसा कार्य करतो

हे टूल काय करते

टेक्स्ट ↔ युनिकोड साधन मजकूराला आणि मजकूरातून युनिकोड कोड पॉइंट्समध्ये अनेक नोटेशन्समध्ये रूपांतरित करते: U+XXXX, JavaScript escapes (\uXXXX किंवा \u{XXXXX}), दशांश, 0xHEX, आणि HTML numeric entities (&#N; किंवा &#xHEX;). डिकोडर लवचिक आहे — तो मजकुरात मिसळलेल्या या नोटेशन्सच्या कोणत्याही संयोजनाला ओळखतो आणि कोड पॉइंट्स काढतो. एन्कोडर तुम्हाला आउटपुट फॉरमॅट आणि कोड पॉइंट्समधील विभाजक निवडू देतो.

डेव्हलपरसाठी सामान्य वापर प्रकरणे

फ्रंटएंड डेव्हलपर्स JSON फाइल्स, सोर्स कोड, किंवा मर्यादित चॅनेल्सवर ट्रान्सपोर्टसाठी इमोजी आणि CJK अक्षरे सुरक्षित ASCII escape sequences मध्ये रूपांतरित करण्यासाठी हे साधन वापरतात. लोकॅलायझेशन इंजिनिअर्स अनुवादित स्ट्रिंगमध्ये वापरलेले अचूक कोड पॉइंट्स पडताळतात. कॉपी केलेल्या स्निपेटमध्ये लपलेली अदृश्य किंवा दिसायला सारखी अक्षरे (homoglyphs, zero-width joiners, RTL marks) शोधण्यासाठीही हे साधन उपयुक्त आहे.

डेटा फॉरमॅट्स, प्रकार किंवा व्हेरिएंट्स

युनिकोडची मानक नोटेशन Basic Multilingual Plane साठी U+XXXX आणि supplementary planes साठी U+XXXXX अशी आहे. JavaScript escapes BMP साठी \uXXXX आणि पूर्ण रेंजसाठी \u{XXXXX} (ES2015+) वापरतात. HTML numeric entities स्वीकारते (दशांश &#N; किंवा hex &#xN;). साधे दशांश आणि 0xHEX फॉरमॅट्स codePointAt / fromCodePoint मधून अतिरिक्त अर्थ लावल्याशिवाय round-trip होतात. Astral अक्षरे (🌍 सारखी इमोजी) U+FFFF पेक्षा वरच्या एकाच कोड पॉइंट म्हणून दर्शवली जातात.

सामान्य चुका आणि एज केसेस

Astral अक्षरे जुन्या \uXXXX फॉर्मने व्यक्त करता येत नाहीत कारण प्रत्येक escape फक्त 4 hex digits असतो — \u{...} किंवा surrogate pair वापरा. U+10FFFF पेक्षा वरचे कोड पॉइंट्स Unicode spec नुसार अवैध आहेत आणि नाकारले जातील. Combining marks आणि emoji ZWJ sequences अनेक कोड पॉइंट्स म्हणून दिसतात, जरी ते एकाच glyph म्हणून रेंडर होत असले तरी. डिकोडर HTML named entities (©, &) चे अर्थ लावत नाही — त्यासाठी स्वतंत्र HTML decoder वापरा.

कोडच्या तुलनेत हे टूल कधी वापरावे

जलद तपासणी, escape-sequence जनरेशन, आणि homoglyph शोधण्यासाठी ब्राउझर टूल वापरा. कोडमध्ये, भाषा-नेटिव्ह string APIs (`String.fromCodePoint`, JS मध्ये code-point iteration साठी `Array.from(str)`; Python मध्ये `chr` आणि `ord`; Java मध्ये `Character.toCodePoint`) आणि normalization (NFC/NFD), case folding, किंवा grapheme-cluster segmentation हवे असल्यास पूर्ण ICU लायब्ररीज प्राधान्याने वापरा.