DevToys Web Pro iconDevToys Web ProBlogg
Betygsätt oss:
Prova webbläsartillägget:

Text ↔ Unicode-omvandlare

Läge
Format

Text

  • Unicode

  • Tekniska detaljer

    Så fungerar Text ↔ Unicode-konverteraren

    Vad verktyget gör

    Verktyget Text ↔ Unicode konverterar text till och från Unicode-kodpunkter i flera notationer: U+XXXX, JavaScript-escapes (\uXXXX eller \u{XXXXX}), decimal, 0xHEX och numeriska HTML-entiteter (&#N; eller &#xHEX;). Avkodaren är tillåtande — den känner igen valfri kombination av dessa notationer insprängda i text och extraherar kodpunkterna. Kodaren låter dig välja utdataformat och en avgränsare mellan kodpunkter.

    Vanliga användningsfall för utvecklare

    Frontendutvecklare använder verktyget för att översätta emoji och CJK-tecken till säkra ASCII-escape-sekvenser för JSON-filer, källkod eller transport över restriktiva kanaler. Lokaliseringstekniker verifierar de exakta kodpunkter som används i en översatt sträng. Verktyget är också användbart för att upptäcka osynliga eller snarlika tecken (homoglyfer, nollbredds-joiners, RTL-markörer) som gömmer sig i ett kopierat utdrag.

    Dataformat, typer eller varianter

    Unicodes standardnotation är U+XXXX för Basic Multilingual Plane och U+XXXXX för kompletterande plan. JavaScript-escapes använder \uXXXX för BMP och \u{XXXXX} (ES2015+) för hela intervallet. HTML accepterar numeriska entiteter (decimal &#N; eller hex &#xN;). Vanliga decimal- och 0xHEX-format kan rundtrippas via codePointAt / fromCodePoint utan vidare tolkning. Astrala tecken (emoji som 🌍) representeras som en enda kodpunkt över U+FFFF.

    Vanliga fallgropar och specialfall

    Astrala tecken kan inte uttryckas med den äldre \uXXXX-formen eftersom varje escape bara är 4 hexsiffror — använd \u{...} eller ett surrogatpar. Kodpunkter över U+10FFFF är ogiltiga enligt Unicode-specifikationen och kommer att avvisas. Kombinerande diakritiska tecken och emoji-ZWJ-sekvenser visas som flera kodpunkter även om de renderas som en enda glyf. Avkodaren tolkar inte namngivna HTML-entiteter (©, &) — använd en dedikerad HTML-avkodare för dem.

    När du ska använda det här verktyget jämfört med kod

    Använd webbläsarverktyget för snabb inspektion, generering av escape-sekvenser och homoglyph-jakt. I kod bör du föredra språkets inbyggda sträng-API:er (`String.fromCodePoint`, `Array.from(str)` för kodpunktsiteration i JS; `chr` och `ord` i Python; `Character.toCodePoint` i Java) samt fullständiga ICU-bibliotek när du behöver normalisering (NFC/NFD), case folding eller segmentering av grafemkluster.