What output formats are supported?

U+XXXX (Unicode standard), \uXXXX or \u{XXXXX} (JavaScript escapes), decimal, 0xHEX, and HTML numeric entities &#N; / &#xN;. The decoder accepts any of these mixed in the same input.

Yes. Emojis are mostly above U+FFFF, so they use 5-digit hex (U+1F30D, \u{1F30D}, etc.) The tool emits the correct astral form automatically.

Will HTML named entities like & decode?

No — only numeric entities (A or A) are decoded here. For named entities use the HTML Encoder/Decoder tool.

Konwerter tekst ↔ Unicode

Tryb

Format

Tekst

Unicode

U+0048 U+0065 U+006C U+006C U+006F U+0021 U+0020 U+1F30D

Szczegóły techniczne

Jak działa konwerter Tekst ↔ Unicode

Co robi narzędzie

Narzędzie Tekst ↔ Unicode konwertuje tekst na i z punktów kodowych Unicode w wielu notacjach: U+XXXX, sekwencje ucieczki JavaScript (\uXXXX lub \u{XXXXX}), dziesiętna, 0xHEX oraz numeryczne encje HTML (&#N; lub &#xHEX;). Dekoder jest tolerancyjny — rozpoznaje dowolną kombinację tych notacji przeplataną tekstem i wyodrębnia punkty kodowe. Koder pozwala wybrać format wyjściowy oraz separator między punktami kodowymi.

Typowe zastosowania dla programistów

Programiści frontendowi używają narzędzia do zamiany emoji i znaków CJK na bezpieczne sekwencje ucieczki ASCII dla plików JSON, kodu źródłowego lub transmisji przez restrykcyjne kanały. Inżynierowie lokalizacji weryfikują dokładne punkty kodowe użyte w przetłumaczonym ciągu. Narzędzie jest też pomocne w wykrywaniu niewidocznych lub podobnie wyglądających znaków (homoglify, łączniki o zerowej szerokości, znaczniki RTL) ukrytych w skopiowanym fragmencie.

Formaty danych, typy lub warianty

Standardowa notacja Unicode to U+XXXX dla Podstawowej Płaszczyzny Wielojęzycznej oraz U+XXXXX dla płaszczyzn dodatkowych. Sekwencje ucieczki JavaScript używają \uXXXX dla BMP oraz \u{XXXXX} (ES2015+) dla pełnego zakresu. HTML akceptuje numeryczne encje (dziesiętne &#N; lub szesnastkowe &#xN;). Zwykły zapis dziesiętny i 0xHEX przechodzą w obie strony przez codePointAt / fromCodePoint bez dodatkowej interpretacji. Znaki astralne (emoji takie jak 🌍) są reprezentowane jako pojedynczy punkt kodowy powyżej U+FFFF.

Typowe pułapki i przypadki brzegowe

Znaków astralnych nie da się wyrazić starszą formą \uXXXX, ponieważ każda sekwencja ma tylko 4 cyfry szesnastkowe — użyj \u{...} albo pary surogatów. Punkty kodowe powyżej U+10FFFF są nieprawidłowe według specyfikacji Unicode i zostaną odrzucone. Znaki łączące oraz sekwencje emoji ZWJ występują jako wiele punktów kodowych, mimo że renderują się jako pojedynczy glif. Dekoder nie interpretuje nazwanych encji HTML (©, &) — do tego użyj dedykowanego dekodera HTML.

Kiedy używać tego narzędzia zamiast kodu

Użyj narzędzia w przeglądarce do szybkiej inspekcji, generowania sekwencji ucieczki i polowania na homoglif y. W kodzie preferuj natywne API łańcuchów znaków danego języka (`String.fromCodePoint`, `Array.from(str)` do iteracji po punktach kodowych w JS; `chr` i `ord` w Pythonie; `Character.toCodePoint` w Javie) oraz pełne biblioteki ICU, gdy potrzebujesz normalizacji (NFC/NFD), składania wielkości liter (case folding) lub segmentacji klastrów grafemów.