DevToys Web Pro iconDevToys Web ProBlog
Bedøm os:
Prøv browserudvidelsen:

Tekst ↔ Unicode-konverter

Tilstand
Format

Tekst

  • Unicode

  • Tekniske detaljer

    Sådan fungerer Tekst ↔ Unicode-konverteren

    Hvad værktøjet gør

    Værktøjet Tekst ↔ Unicode konverterer tekst til og fra Unicode-kodepunkter i flere notationer: U+XXXX, JavaScript-escapes (\uXXXX eller \u{XXXXX}), decimal, 0xHEX og HTML numeriske entiteter (&#N; eller &#xHEX;). Dekoderen er tolerant — den genkender enhver kombination af disse notationer blandet med tekst og udtrækker kodepunkterne. Enkoderen lader dig vælge outputformat og en separator mellem kodepunkter.

    Almindelige anvendelsestilfælde for udviklere

    Frontend-udviklere bruger værktøjet til at omsætte emoji og CJK-tegn til sikre ASCII-escape-sekvenser til JSON-filer, kildekode eller transport over restriktive kanaler. Lokaliseringsteknikere verificerer de præcise kodepunkter, der bruges i en oversat streng. Værktøjet er også nyttigt til at opdage usynlige eller forvekslelige tegn (homoglyffer, zero-width joiners, RTL-mærker), der gemmer sig i et kopieret uddrag.

    Dataformater, typer eller varianter

    Unicode-standardnotationen er U+XXXX for Basic Multilingual Plane og U+XXXXX for supplerende planer. JavaScript-escapes bruger \uXXXX for BMP og \u{XXXXX} (ES2015+) for hele området. HTML accepterer numeriske entiteter (decimal &#N; eller hex &#xN;). Almindelig decimal og 0xHEX-formater kan round-trippes via codePointAt / fromCodePoint uden yderligere fortolkning. Astrale tegn (emoji som 🌍) repræsenteres som et enkelt kodepunkt over U+FFFF.

    Almindelige faldgruber og kanttilfælde

    Astrale tegn kan ikke udtrykkes med den ældre \uXXXX-form, fordi hver escape kun er 4 hex-cifre — brug \u{...} eller et surrogatpar. Kodepunkter over U+10FFFF er ugyldige ifølge Unicode-specifikationen og vil blive afvist. Kombinerende diakritiske tegn og emoji-ZWJ-sekvenser fremstår som flere kodepunkter, selv om de gengives som en enkelt glyf. Dekoderen fortolker ikke HTML-navngivne entiteter (©, &) — brug en dedikeret HTML-dekoder til dem.

    Hvornår du skal bruge dette værktøj vs. kode

    Brug browserværktøjet til hurtig inspektion, generering af escape-sekvenser og jagt på homoglyffer. I kode bør du foretrække sprogets indbyggede streng-API'er (`String.fromCodePoint`, `Array.from(str)` til kodepunkts-iteration i JS; `chr` og `ord` i Python; `Character.toCodePoint` i Java) samt fulde ICU-biblioteker, når du har brug for normalisering (NFC/NFD), case folding eller segmentering af grafemklynger.