DevToys Web Pro iconDevToys Web ProBlog
Bizi değerlendirin:
Tarayıcı uzantısını deneyin:

Metin ↔ Unicode Dönüştürücü

Mod
Biçim

Metin

  • Unicode

  • Teknik ayrıntılar

    Metin ↔ Unicode Dönüştürücü Nasıl Çalışır

    Araç Ne Yapar

    Metin ↔ Unicode aracı, metni birden fazla gösterimde Unicode kod noktalarına dönüştürür ve geri çevirir: U+XXXX, JavaScript kaçışları (\uXXXX veya \u{XXXXX}), ondalık, 0xHEX ve HTML sayısal varlıkları (&#N; veya &#xHEX;). Kod çözücü esnektir — metinle iç içe geçmiş bu gösterimlerin herhangi bir kombinasyonunu tanır ve kod noktalarını ayıklar. Kodlayıcı, çıktı biçimini ve kod noktaları arasındaki ayırıcıyı seçmenize olanak tanır.

    Yaygın Geliştirici Kullanım Senaryoları

    Frontend geliştiricileri aracı, emoji ve CJK karakterlerini JSON dosyaları, kaynak kodu veya kısıtlayıcı kanallar üzerinden taşıma için güvenli ASCII kaçış dizilerine çevirmek üzere kullanır. Yerelleştirme mühendisleri, çevrilmiş bir dizede kullanılan tam kod noktalarını doğrular. Araç ayrıca kopyalanmış bir parçacığın içine gizlenmiş görünmez veya benzer görünümlü karakterleri (homoglifler, sıfır genişlikli birleştiriciler, RTL işaretleri) tespit etmek için de faydalıdır.

    Veri Biçimleri, Türleri veya Varyantlar

    Unicode standart gösterimi, Temel Çok Dilli Düzlem için U+XXXX ve ek düzlemler için U+XXXXX şeklindedir. JavaScript kaçışları BMP için \uXXXX ve tam aralık için \u{XXXXX} (ES2015+) kullanır. HTML sayısal varlıkları kabul eder (ondalık &#N; veya onaltılık &#xN;). Düz ondalık ve 0xHEX biçimleri, ek yorumlama olmadan codePointAt / fromCodePoint üzerinden bire bir dönüştürülebilir. Astral karakterler (🌍 gibi emojiler) U+FFFF üzerindeki tek bir kod noktası olarak temsil edilir.

    Yaygın Hatalar ve Sınır Durumları

    Astral karakterler eski \uXXXX biçimiyle ifade edilemez çünkü her kaçış yalnızca 4 onaltılık basamaktır — \u{...} veya bir surrogate çifti kullanın. U+10FFFF üzerindeki kod noktaları Unicode spesifikasyonuna göre geçersizdir ve reddedilir. Birleştirme işaretleri ve emoji ZWJ dizileri, tek bir glif olarak render edilseler bile birden fazla kod noktası olarak görünür. Kod çözücü HTML adlandırılmış varlıklarını (©, &) yorumlamaz — bunlar için özel bir HTML kod çözücü kullanın.

    Bu Aracı Ne Zaman Kullanmalı, Ne Zaman Kod Yazmalı

    Hızlı inceleme, kaçış dizisi üretimi ve homoglif avı için tarayıcı aracını kullanın. Kod tarafında, dilin yerel string API'lerini tercih edin (`String.fromCodePoint`, JS'de kod noktası iterasyonu için `Array.from(str)`; Python'da `chr` ve `ord`; Java'da `Character.toCodePoint`) ve normalizasyon (NFC/NFD), case folding veya grapheme-cluster segmentasyonu gerektiğinde tam ICU kütüphanelerini kullanın.