What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

टेक्स्ट ↔ Unicode परिवर्तक

मोड

फ़ॉर्मेट

टेक्स्ट

यूनिकोड

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

तकनीकी विवरण

टेक्स्ट ↔ यूनिकोड कन्वर्टर कैसे काम करता है

यह टूल क्या करता है

टेक्स्ट ↔ यूनिकोड टूल टेक्स्ट को यूनिकोड कोड पॉइंट्स में और उनसे वापस कई नोटेशन में बदलता है: U+XXXX, JavaScript escapes (\uXXXX या \u{XXXXX}), decimal, 0xHEX, और HTML numeric entities (&#N; या &#xHEX;). डिकोडर लचीला है — यह टेक्स्ट के बीच में मिले इन नोटेशनों के किसी भी संयोजन को पहचानता है और कोड पॉइंट्स निकाल लेता है। एन्कोडर आपको आउटपुट फ़ॉर्मैट और कोड पॉइंट्स के बीच सेपरेटर चुनने देता है।

डेवलपर्स के सामान्य उपयोग मामले

फ्रंटएंड डेवलपर्स इस टूल का उपयोग emoji और CJK अक्षरों को JSON फ़ाइलों, सोर्स कोड, या प्रतिबंधित चैनलों पर ट्रांसपोर्ट के लिए सुरक्षित ASCII escape sequences में बदलने के लिए करते हैं। लोकलाइज़ेशन इंजीनियर्स अनुवादित स्ट्रिंग में उपयोग हुए सटीक कोड पॉइंट्स की पुष्टि करते हैं। यह टूल कॉपी किए गए स्निपेट के अंदर छिपे अदृश्य या एक जैसे दिखने वाले अक्षरों (homoglyphs, zero-width joiners, RTL marks) को पहचानने में भी मदद करता है।

डेटा फ़ॉर्मैट्स, टाइप्स, या वैरिएंट्स

यूनिकोड का मानक नोटेशन Basic Multilingual Plane के लिए U+XXXX और supplementary planes के लिए U+XXXXX है। JavaScript escapes BMP के लिए \uXXXX और पूरे रेंज के लिए \u{XXXXX} (ES2015+) का उपयोग करते हैं। HTML numeric entities (decimal &#N; या hex &#xN;) स्वीकार करता है। Plain decimal और 0xHEX फ़ॉर्मैट codePointAt / fromCodePoint के जरिए बिना अतिरिक्त व्याख्या के round-trip होते हैं। Astral characters (emoji जैसे 🌍) U+FFFF से ऊपर एक ही कोड पॉइंट के रूप में दर्शाए जाते हैं।

सामान्य समस्याएँ और किनारी मामले

Astral characters को पुराने \uXXXX फ़ॉर्म से व्यक्त नहीं किया जा सकता क्योंकि हर escape केवल 4 hex digits का होता है — \u{...} या surrogate pair का उपयोग करें। U+10FFFF से ऊपर के code points यूनिकोड स्पेसिफिकेशन के अनुसार अमान्य हैं और अस्वीकार कर दिए जाएंगे। Combining marks और emoji ZWJ sequences कई code points के रूप में दिखाई देते हैं, भले ही वे एक ही glyph की तरह रेंडर हों। डिकोडर HTML named entities (©, &) की व्याख्या नहीं करेगा — उनके लिए एक dedicated HTML decoder का उपयोग करें।

यह टूल बनाम कोड कब उपयोग करें

त्वरित निरीक्षण, escape-sequence जनरेशन, और homoglyph hunting के लिए ब्राउज़र टूल का उपयोग करें। कोड में, भाषा-नेटिव string APIs (`String.fromCodePoint`, `Array.from(str)` JS में code-point iteration के लिए; Python में `chr` और `ord`; Java में `Character.toCodePoint`) को प्राथमिकता दें, और जब आपको normalization (NFC/NFD), case folding, या grapheme-cluster segmentation चाहिए तो पूर्ण ICU लाइब्रेरीज़ का उपयोग करें।