टेक्स्ट ↔ Unicode परिवर्तक
टेक्स्ट
यूनिकोड
तकनीकी विवरण
टेक्स्ट ↔ यूनिकोड कन्वर्टर कैसे काम करता है
यह टूल क्या करता है
टेक्स्ट ↔ यूनिकोड टूल टेक्स्ट को यूनिकोड कोड पॉइंट्स में और उनसे वापस कई नोटेशन में बदलता है: U+XXXX, JavaScript escapes (\uXXXX या \u{XXXXX}), decimal, 0xHEX, और HTML numeric entities (&#N; या &#xHEX;). डिकोडर लचीला है — यह टेक्स्ट के बीच में मिले इन नोटेशनों के किसी भी संयोजन को पहचानता है और कोड पॉइंट्स निकाल लेता है। एन्कोडर आपको आउटपुट फ़ॉर्मैट और कोड पॉइंट्स के बीच सेपरेटर चुनने देता है।
डेवलपर्स के सामान्य उपयोग मामले
फ्रंटएंड डेवलपर्स इस टूल का उपयोग emoji और CJK अक्षरों को JSON फ़ाइलों, सोर्स कोड, या प्रतिबंधित चैनलों पर ट्रांसपोर्ट के लिए सुरक्षित ASCII escape sequences में बदलने के लिए करते हैं। लोकलाइज़ेशन इंजीनियर्स अनुवादित स्ट्रिंग में उपयोग हुए सटीक कोड पॉइंट्स की पुष्टि करते हैं। यह टूल कॉपी किए गए स्निपेट के अंदर छिपे अदृश्य या एक जैसे दिखने वाले अक्षरों (homoglyphs, zero-width joiners, RTL marks) को पहचानने में भी मदद करता है।
डेटा फ़ॉर्मैट्स, टाइप्स, या वैरिएंट्स
यूनिकोड का मानक नोटेशन Basic Multilingual Plane के लिए U+XXXX और supplementary planes के लिए U+XXXXX है। JavaScript escapes BMP के लिए \uXXXX और पूरे रेंज के लिए \u{XXXXX} (ES2015+) का उपयोग करते हैं। HTML numeric entities (decimal &#N; या hex &#xN;) स्वीकार करता है। Plain decimal और 0xHEX फ़ॉर्मैट codePointAt / fromCodePoint के जरिए बिना अतिरिक्त व्याख्या के round-trip होते हैं। Astral characters (emoji जैसे 🌍) U+FFFF से ऊपर एक ही कोड पॉइंट के रूप में दर्शाए जाते हैं।
सामान्य समस्याएँ और किनारी मामले
Astral characters को पुराने \uXXXX फ़ॉर्म से व्यक्त नहीं किया जा सकता क्योंकि हर escape केवल 4 hex digits का होता है — \u{...} या surrogate pair का उपयोग करें। U+10FFFF से ऊपर के code points यूनिकोड स्पेसिफिकेशन के अनुसार अमान्य हैं और अस्वीकार कर दिए जाएंगे। Combining marks और emoji ZWJ sequences कई code points के रूप में दिखाई देते हैं, भले ही वे एक ही glyph की तरह रेंडर हों। डिकोडर HTML named entities (©, &) की व्याख्या नहीं करेगा — उनके लिए एक dedicated HTML decoder का उपयोग करें।
यह टूल बनाम कोड कब उपयोग करें
त्वरित निरीक्षण, escape-sequence जनरेशन, और homoglyph hunting के लिए ब्राउज़र टूल का उपयोग करें। कोड में, भाषा-नेटिव string APIs (`String.fromCodePoint`, `Array.from(str)` JS में code-point iteration के लिए; Python में `chr` और `ord`; Java में `Character.toCodePoint`) को प्राथमिकता दें, और जब आपको normalization (NFC/NFD), case folding, या grapheme-cluster segmentation चाहिए तो पूर्ण ICU लाइब्रेरीज़ का उपयोग करें।