DevToys Web Pro iconDevToys Web ProBlogg
Vurder oss:
Prøv nettleserutvidelsen:

Tekst ↔ Unicode-konverterer

Modus
Format

Tekst

  • Unicode

  • Tekniske detaljer

    Slik fungerer tekst ↔ Unicode-konverteren

    Hva verktøyet gjør

    Verktøyet Tekst ↔ Unicode konverterer tekst til og fra Unicode-kodepunkter i flere notasjoner: U+XXXX, JavaScript-escapes (\uXXXX eller \u{XXXXX}), desimal, 0xHEX og HTML numeriske entiteter (&#N; eller &#xHEX;). Dekoderen er tolerant — den gjenkjenner enhver kombinasjon av disse notasjonene blandet inn i tekst og trekker ut kodepunktene. Enkoderen lar deg velge utdataformat og en skilletegn mellom kodepunkter.

    Vanlige bruksområder for utviklere

    Frontend-utviklere bruker verktøyet til å oversette emoji og CJK-tegn til trygge ASCII-escape-sekvenser for JSON-filer, kildekode eller transport over restriktive kanaler. Lokaliseringsteknikere verifiserer de nøyaktige kodepunktene som brukes i en oversatt streng. Verktøyet er også nyttig for å oppdage usynlige eller forvekslingslignende tegn (homoglyfer, nullbredde-sammenføynere, RTL-merker) som skjuler seg i et kopiert utdrag.

    Dataformater, typer eller varianter

    Unicode-standardnotasjon er U+XXXX for Basic Multilingual Plane og U+XXXXX for supplerende plan. JavaScript-escapes bruker \uXXXX for BMP og \u{XXXXX} (ES2015+) for hele området. HTML godtar numeriske entiteter (desimal &#N; eller heks &#xN;). Rene desimal- og 0xHEX-formater kan rundtrippes via codePointAt / fromCodePoint uten videre tolkning. Astrale tegn (emoji som 🌍) representeres som ett enkelt kodepunkt over U+FFFF.

    Vanlige fallgruver og kanttilfeller

    Astrale tegn kan ikke uttrykkes med den eldre \uXXXX-formen fordi hver escape bare er 4 heksadesimale sifre — bruk \u{...} eller et surrogatpar. Kodepunkter over U+10FFFF er ugyldige i henhold til Unicode-spesifikasjonen og vil bli avvist. Kombineringsmerker og emoji-ZWJ-sekvenser vises som flere kodepunkter selv om de rendres som én enkelt glyf. Dekoderen tolker ikke HTML-navngitte entiteter (©, &) — bruk en dedikert HTML-dekoder for disse.

    Når du bør bruke dette verktøyet vs. kode

    Bruk nettleserverktøyet for rask inspeksjon, generering av escape-sekvenser og jakt på homoglyfer. I kode bør du foretrekke språkets innebygde streng-API-er (`String.fromCodePoint`, `Array.from(str)` for kodepunkt-iterasjon i JS; `chr` og `ord` i Python; `Character.toCodePoint` i Java) samt fullverdige ICU-biblioteker når du trenger normalisering (NFC/NFD), case folding eller segmentering av grafemklynger.