DevToys Web Pro iconDevToys Web Proব্লগ
আমাদের রেট দিন:
ব্রাউজার এক্সটেনশন ব্যবহার করে দেখুন:

টেক্সট ↔ ইউনিকোড কনভার্টার

মোড
ফরম্যাট

টেক্সট

  • ইউনিকোড

  • প্রযুক্তিগত বিবরণ

    টেক্সট ↔ ইউনিকোড কনভার্টার কীভাবে কাজ করে

    টুলটি কী করে

    টেক্সট ↔ ইউনিকোড টুলটি একাধিক নোটেশনে টেক্সটকে ইউনিকোড কোড পয়েন্টে এবং সেখান থেকে আবার টেক্সটে রূপান্তর করে: U+XXXX, JavaScript escapes (\uXXXX বা \u{XXXXX}), দশমিক, 0xHEX, এবং HTML numeric entities (&#N; বা &#xHEX;)। ডিকোডারটি নমনীয় — এটি টেক্সটের মধ্যে মিশে থাকা এসব নোটেশনের যেকোনো সমন্বয় চিনতে পারে এবং কোড পয়েন্টগুলো বের করে। এনকোডার আপনাকে আউটপুট ফরম্যাট এবং কোড পয়েন্টগুলোর মধ্যে একটি সেপারেটর বেছে নিতে দেয়।

    ডেভেলপারদের সাধারণ ব্যবহারক্ষেত্র

    ফ্রন্টএন্ড ডেভেলপাররা JSON ফাইল, সোর্স কোড, বা সীমাবদ্ধ চ্যানেলে পরিবহনের জন্য ইমোজি এবং CJK অক্ষরকে নিরাপদ ASCII escape sequence-এ রূপান্তর করতে এই টুল ব্যবহার করেন। লোকালাইজেশন ইঞ্জিনিয়াররা অনূদিত স্ট্রিংয়ে ব্যবহৃত সঠিক কোড পয়েন্ট যাচাই করেন। কপি করা কোনো স্নিপেটের ভেতরে লুকিয়ে থাকা অদৃশ্য বা দেখতে-একই ধরনের অক্ষর (homoglyphs, zero-width joiners, RTL marks) শনাক্ত করতেও টুলটি সহায়ক।

    ডেটা ফরম্যাট, টাইপ বা ভ্যারিয়েন্ট

    ইউনিকোড স্ট্যান্ডার্ড নোটেশন হলো Basic Multilingual Plane-এর জন্য U+XXXX এবং supplementary planes-এর জন্য U+XXXXX। JavaScript escapes BMP-এর জন্য \uXXXX এবং পূর্ণ রেঞ্জের জন্য \u{XXXXX} (ES2015+) ব্যবহার করে। HTML numeric entities (দশমিক &#N; বা হেক্স &#xN;) গ্রহণ করে। সাধারণ দশমিক এবং 0xHEX ফরম্যাট codePointAt / fromCodePoint দিয়ে অতিরিক্ত ব্যাখ্যা ছাড়াই round-trip করে। Astral অক্ষর (🌍-এর মতো ইমোজি) U+FFFF-এর উপরে একটি একক কোড পয়েন্ট হিসেবে উপস্থাপিত হয়।

    সাধারণ ভুল ও এজ কেস

    পুরোনো \uXXXX ফর্ম দিয়ে Astral অক্ষর প্রকাশ করা যায় না, কারণ প্রতিটি escape মাত্র ৪টি হেক্স ডিজিট — \u{...} বা একটি surrogate pair ব্যবহার করুন। Unicode স্পেসিফিকেশন অনুযায়ী U+10FFFF-এর উপরের কোড পয়েন্ট অবৈধ এবং প্রত্যাখ্যাত হবে। Combining marks এবং emoji ZWJ sequence একাধিক কোড পয়েন্ট হিসেবে দেখা যায়, যদিও তারা রেন্ডারে একটি একক glyph হিসেবে প্রদর্শিত হয়। ডিকোডার HTML named entities (©, &) ব্যাখ্যা করবে না — সেগুলোর জন্য আলাদা HTML ডিকোডার ব্যবহার করুন।

    কোডের বদলে কখন এই টুল ব্যবহার করবেন

    দ্রুত পরিদর্শন, escape-sequence তৈরি, এবং homoglyph খোঁজার জন্য ব্রাউজার টুলটি ব্যবহার করুন। কোডে, ভাষা-নেটিভ স্ট্রিং API-কে অগ্রাধিকার দিন (`String.fromCodePoint`, JS-এ code-point iteration-এর জন্য `Array.from(str)`; Python-এ `chr` এবং `ord`; Java-তে `Character.toCodePoint`) এবং যখন normalization (NFC/NFD), case folding, বা grapheme-cluster segmentation দরকার হয় তখন পূর্ণ ICU লাইব্রেরি ব্যবহার করুন।