मजकूर ↔ Unicode रूपांतरक
मजकूर
युनिकोड
तांत्रिक तपशील
टेक्स्ट ↔ युनिकोड कन्व्हर्टर कसा कार्य करतो
हे टूल काय करते
टेक्स्ट ↔ युनिकोड साधन मजकूराला आणि मजकूरातून युनिकोड कोड पॉइंट्समध्ये अनेक नोटेशन्समध्ये रूपांतरित करते: U+XXXX, JavaScript escapes (\uXXXX किंवा \u{XXXXX}), दशांश, 0xHEX, आणि HTML numeric entities (&#N; किंवा &#xHEX;). डिकोडर लवचिक आहे — तो मजकुरात मिसळलेल्या या नोटेशन्सच्या कोणत्याही संयोजनाला ओळखतो आणि कोड पॉइंट्स काढतो. एन्कोडर तुम्हाला आउटपुट फॉरमॅट आणि कोड पॉइंट्समधील विभाजक निवडू देतो.
डेव्हलपरसाठी सामान्य वापर प्रकरणे
फ्रंटएंड डेव्हलपर्स JSON फाइल्स, सोर्स कोड, किंवा मर्यादित चॅनेल्सवर ट्रान्सपोर्टसाठी इमोजी आणि CJK अक्षरे सुरक्षित ASCII escape sequences मध्ये रूपांतरित करण्यासाठी हे साधन वापरतात. लोकॅलायझेशन इंजिनिअर्स अनुवादित स्ट्रिंगमध्ये वापरलेले अचूक कोड पॉइंट्स पडताळतात. कॉपी केलेल्या स्निपेटमध्ये लपलेली अदृश्य किंवा दिसायला सारखी अक्षरे (homoglyphs, zero-width joiners, RTL marks) शोधण्यासाठीही हे साधन उपयुक्त आहे.
डेटा फॉरमॅट्स, प्रकार किंवा व्हेरिएंट्स
युनिकोडची मानक नोटेशन Basic Multilingual Plane साठी U+XXXX आणि supplementary planes साठी U+XXXXX अशी आहे. JavaScript escapes BMP साठी \uXXXX आणि पूर्ण रेंजसाठी \u{XXXXX} (ES2015+) वापरतात. HTML numeric entities स्वीकारते (दशांश &#N; किंवा hex &#xN;). साधे दशांश आणि 0xHEX फॉरमॅट्स codePointAt / fromCodePoint मधून अतिरिक्त अर्थ लावल्याशिवाय round-trip होतात. Astral अक्षरे (🌍 सारखी इमोजी) U+FFFF पेक्षा वरच्या एकाच कोड पॉइंट म्हणून दर्शवली जातात.
सामान्य चुका आणि एज केसेस
Astral अक्षरे जुन्या \uXXXX फॉर्मने व्यक्त करता येत नाहीत कारण प्रत्येक escape फक्त 4 hex digits असतो — \u{...} किंवा surrogate pair वापरा. U+10FFFF पेक्षा वरचे कोड पॉइंट्स Unicode spec नुसार अवैध आहेत आणि नाकारले जातील. Combining marks आणि emoji ZWJ sequences अनेक कोड पॉइंट्स म्हणून दिसतात, जरी ते एकाच glyph म्हणून रेंडर होत असले तरी. डिकोडर HTML named entities (©, &) चे अर्थ लावत नाही — त्यासाठी स्वतंत्र HTML decoder वापरा.
कोडच्या तुलनेत हे टूल कधी वापरावे
जलद तपासणी, escape-sequence जनरेशन, आणि homoglyph शोधण्यासाठी ब्राउझर टूल वापरा. कोडमध्ये, भाषा-नेटिव्ह string APIs (`String.fromCodePoint`, JS मध्ये code-point iteration साठी `Array.from(str)`; Python मध्ये `chr` आणि `ord`; Java मध्ये `Character.toCodePoint`) आणि normalization (NFC/NFD), case folding, किंवा grapheme-cluster segmentation हवे असल्यास पूर्ण ICU लायब्ररीज प्राधान्याने वापरा.