What does the Strip HTML Tags tool do?

It removes all HTML markup from text — opening and closing tags, attributes, comments, and blocks — and returns only the visible text content. All processing happens in your browser; nothing is sent to a server.

Does it decode HTML entities like & and €?

Yes. When the 'Decode entities' option is on (default), it decodes both named entities (&, ©, —, ) and numeric references (€, €). Turn the option off to keep entities literal.

Will line breaks be preserved?

By default yes. and block-level closing tags ( , , , ...) become newlines so the output reads naturally. Disable 'Preserve line breaks' to collapse everything to a single space-separated line.

Are and contents removed?

Yes — by default both are stripped entirely along with their contents, so you don't end up with stray CSS or JavaScript in the plain-text output. Both behaviors can be toggled individually.

Удаление HTML-тегов

10 теги удалены245 символов удалено

Сохранять переносы строк

Декодировать сущности

Удалять скрипты

Удалять стили

Ввод HTML

Вывод простого текста

Welcome to DevToys Web Pro

  This is a sample paragraph with a link.

    List item one

    List item two & more

  Special entities: © ™ — … €

Технические детали

Как работает инструмент Strip HTML Tags

Что делает инструмент

Strip HTML Tags удаляет всю HTML-разметку из текста и возвращает видимое содержимое как обычный текст. Он обрабатывает открывающие и закрывающие теги, атрибуты, самозакрывающиеся теги, комментарии и вложенные структуры. Дополнительные режимы включают декодирование распространённых HTML-сущностей (&, ©, €), сохранение переносов строк на блочных тегах и элементах br, а также полное удаление блоков script и style, чтобы их содержимое не попадало в результат.

Распространенные сценарии использования для разработчиков

Используйте Strip HTML Tags, чтобы преобразовать rich-text письма или контент CMS в обычный текст для SMS-дайджестов, очистить собранный HTML перед сохранением в поисковый индекс, извлечь читаемое содержимое статьи для суммаризации или привести в порядок данные буфера обмена после копирования с отрендеренной веб-страницы. Это также полезно при подготовке тестовых фикстур из продакшен-HTML-страниц, где важен только текст.

Форматы данных, типы или варианты

Входные данные — любая разметка в стиле HTML или XML; выход — обычный текст UTF-8. Числовые ссылки на сущности, такие как € и €, декодируются в соответствующие Unicode-символы, а также поддерживается широкий набор именованных сущностей (&, <, >, ", ',  , ©, ®, ™, …, —, –, «умные» кавычки). При включённом сохранении переносов строк закрывающие теги p, div, li, h1–h6, br и других блочных элементов превращаются в переводы строки, а последовательные пустые строки схлопываются до одной пустой строки.

Распространенные ошибки и крайние случаи

Удаление HTML с помощью regex не заменяет полноценный HTML-парсер при работе со злонамеренным вводом — его не следует использовать для очистки недоверенного HTML перед повторной вставкой куда-либо. Некорректная разметка с несоответствующими тегами может давать неожиданные пробелы. Встроенные base64-изображения, скрипты со строками, похожими на теги, и секции CDATA — всё это имеет пограничные случаи. Для серверной продакшен-санитизации используйте проверенную библиотеку, например DOMPurify, sanitize-html или bleach.

Когда использовать этот инструмент, а когда — код

Используйте этот браузерный инструмент, когда нужна разовая конвертация фрагмента HTML в обычный текст — например, чтобы очистить собранную страницу или скопированное тело письма. В коде приложения предпочтительнее специализированные библиотеки: DOMPurify для санитизации, html-to-text или htmlparser2 для структурированного извлечения текста, и Cheerio или jsdom, когда нужно обходить DOM. Эти библиотеки надёжнее, чем проход regex, обрабатывают пограничные случаи вроде вложенных таблиц, деклараций кодировки и условных комментариев.