Teksti ↔ Unicode -muunnin
Teksti
Unicode
Tekniset tiedot
Miten Teksti ↔ Unicode -muunnin toimii
Mitä työkalu tekee
Teksti ↔ Unicode -työkalu muuntaa tekstin Unicode-koodipisteiksi ja takaisin useissa merkintätavoissa: U+XXXX, JavaScript-escape-sekvenssit (\uXXXX tai \u{XXXXX}), desimaali, 0xHEX sekä HTML:n numeeriset entiteetit (&#N; tai &#xHEX;). Dekooderi on salliva — se tunnistaa minkä tahansa näiden merkintöjen yhdistelmän tekstin seassa ja poimii koodipisteet. Enkooderissa voit valita tulostusmuodon ja koodipisteiden välisen erottimen.
Yleiset kehittäjien käyttötapaukset
Frontend-kehittäjät käyttävät työkalua muuntaakseen emojit ja CJK-merkit turvallisiksi ASCII-escape-sekvensseiksi JSON-tiedostoihin, lähdekoodiin tai siirtoon rajoittavien kanavien kautta. Lokalisaatioinsinöörit varmistavat käännetyssä merkkijonossa käytetyt täsmälliset koodipisteet. Työkalu auttaa myös havaitsemaan näkymättömiä tai samannäköisiä merkkejä (homoglyfit, nollaleveyksiset yhdistäjät, RTL-merkit), jotka piileskelevät kopioidussa pätkässä.
Tietomuodot, tyypit tai variantit
Unicoden standardimerkintä on U+XXXX Basic Multilingual Plane -tasolle ja U+XXXXX lisätasoille. JavaScript-escape-sekvenssit käyttävät \uXXXX BMP:lle ja \u{XXXXX} (ES2015+) koko alueelle. HTML hyväksyy numeeriset entiteetit (desimaali &#N; tai heksa &#xN;). Pelkät desimaali- ja 0xHEX-muodot round-tripataan codePointAt / fromCodePoint -kutsujen kautta ilman lisätulkintaa. Astraalimerkit (emojit kuten 🌍) esitetään yhtenä koodipisteenä U+FFFF:n yläpuolella.
Yleiset sudenkuopat ja reunatapaukset
Astraalimerkkejä ei voi ilmaista vanhemmalla \uXXXX-muodolla, koska jokainen escape on vain 4 heksanumeroa — käytä \u{...} tai sijaissurrogaattiparia. Koodipisteet U+10FFFF:n yläpuolella ovat Unicode-määrittelyn mukaan virheellisiä ja ne hylätään. Yhdistelymerkit ja emoji-ZWJ-sekvenssit näkyvät useina koodipisteinä, vaikka ne renderöityvät yhtenä glyyfinä. Dekooderi ei tulkitse HTML:n nimettyjä entiteettejä (©, &) — käytä niihin erillistä HTML-dekooderia.
Milloin käyttää tätä työkalua vs. koodia
Käytä selainpohjaista työkalua nopeaan tarkasteluun, escape-sekvenssien generointiin ja homoglyphien metsästykseen. Koodissa suosi kielen omia merkkijono-API:ja (`String.fromCodePoint`, `Array.from(str)` koodipisteittäin iterointiin JS:ssä; `chr` ja `ord` Pythonissa; `Character.toCodePoint` Javassa) sekä täysiä ICU-kirjastoja, kun tarvitset normalisointia (NFC/NFD), kirjainkoon yhtenäistämistä tai grafeemiklusterien segmentointia.