ટેક્સ્ટ ↔ Unicode રૂપાંતરક
ટેક્સ્ટ
યુનિકોડ
તકનિકી વિગતો
ટેક્સ્ટ ↔ યુનિકોડ કન્વર્ટર કેવી રીતે કામ કરે છે
આ ટૂલ શું કરે છે
ટેક્સ્ટ ↔ યુનિકોડ ટૂલ ટેક્સ્ટને યુનિકોડ કોડ પોઈન્ટ્સમાં અને તેમાંથી પાછું અનેક નોટેશનોમાં રૂપાંતરિત કરે છે: U+XXXX, JavaScript escapes (\uXXXX or \u{XXXXX}), દશાંશ, 0xHEX, અને HTML સંખ્યાત્મક એન્ટિટીઝ (&#N; or &#xHEX;). ડિકોડર લવચીક છે — તે ટેક્સ્ટ વચ્ચે મિશ્રિત આ નોટેશનોના કોઈપણ સંયોજનને ઓળખે છે અને કોડ પોઈન્ટ્સ કાઢી લે છે. એન્કોડર તમને આઉટપુટ ફોર્મેટ અને કોડ પોઈન્ટ્સ વચ્ચેનો સેપરેટર પસંદ કરવાની મંજૂરી આપે છે.
ડેવલપર્સ માટેના સામાન્ય ઉપયોગ કેસિસ
ફ્રન્ટએન્ડ ડેવલપર્સ આ ટૂલનો ઉપયોગ ઇમોજી અને CJK અક્ષરોને JSON ફાઇલો, સોર્સ કોડ, અથવા પ્રતિબંધિત ચેનલો પર ટ્રાન્સપોર્ટ માટે સુરક્ષિત ASCII એસ્કેપ સિક્વન્સમાં રૂપાંતરિત કરવા માટે કરે છે. લોકલાઇઝેશન ઇજનેરો અનુવાદિત સ્ટ્રિંગમાં વપરાયેલા ચોક્કસ કોડ પોઈન્ટ્સની ચકાસણી કરે છે. કૉપિ કરેલા સ્નિપેટમાં છુપાયેલા અદૃશ્ય અથવા દેખાવમાં સમાન અક્ષરો (homoglyphs, zero-width joiners, RTL marks) શોધવામાં પણ આ ટૂલ મદદરૂપ છે.
ડેટા ફોર્મેટ્સ, પ્રકારો, અથવા વેરિઅન્ટ્સ
યુનિકોડનું સ્ટાન્ડર્ડ નોટેશન Basic Multilingual Plane માટે U+XXXX અને પૂરક પ્લેન્સ માટે U+XXXXX છે. JavaScript escapes BMP માટે \uXXXX અને સંપૂર્ણ રેન્જ માટે \u{XXXXX} (ES2015+) વાપરે છે. HTML સંખ્યાત્મક એન્ટિટીઝ સ્વીકારે છે (દશાંશ &#N; અથવા હેક્સ &#xN;). સાદા દશાંશ અને 0xHEX ફોર્મેટ્સ codePointAt / fromCodePoint મારફતે વધારાની વ્યાખ્યા વિના રાઉન્ડ-ટ્રિપ થાય છે. એસ્ટ્રલ અક્ષરો (🌍 જેવા ઇમોજી) U+FFFF કરતાં ઉપરના એક જ કોડ પોઈન્ટ તરીકે રજૂ થાય છે.
સામાન્ય ખામીઓ અને એજ કેસિસ
એસ્ટ્રલ અક્ષરોને જૂના \uXXXX ફોર્મથી વ્યક્ત કરી શકાતાં નથી કારણ કે દરેક એસ્કેપ માત્ર 4 હેક્સ અંકોનો હોય છે — \u{...} અથવા surrogate pair વાપરો. U+10FFFF કરતાં ઉપરના કોડ પોઈન્ટ્સ યુનિકોડ સ્પેક મુજબ અમાન્ય છે અને નકારવામાં આવશે. Combining marks અને emoji ZWJ સિક્વન્સ એક જ ગ્લિફ તરીકે રેન્ડર થાય છે છતાં અનેક કોડ પોઈન્ટ્સ તરીકે દેખાય છે. ડિકોડર HTML named entities (©, &)નું અર્થઘટન કરશે નહીં — તેના માટે ખાસ HTML ડિકોડર વાપરો.
કોડની સામે આ ટૂલ ક્યારે વાપરવું
ઝડપી ઇન્સ્પેક્શન, એસ્કેપ-સિક્વન્સ જનરેશન, અને homoglyph શોધ માટે બ્રાઉઝર ટૂલ વાપરો. કોડમાં, ભાષા-મૂળ સ્ટ્રિંગ APIs પસંદ કરો (`String.fromCodePoint`, JS માં કોડ-પોઈન્ટ ઇટરેશન માટે `Array.from(str)`; Python માં `chr` અને `ord`; Java માં `Character.toCodePoint`) અને જ્યારે તમને normalization (NFC/NFD), case folding, અથવા grapheme-cluster segmentation જોઈએ ત્યારે સંપૂર્ણ ICU લાઇબ્રેરીઝ વાપરો.