DevToys Web Pro iconDevToys Web Pro部落格
為我們評分:
試用瀏覽器擴充功能:

移除 HTML 標籤

10 已移除標籤245 已移除字元

HTML 輸入

  • 純文字輸出

  • 技術細節

    Strip HTML Tags 工具如何運作

    工具功能說明

    Strip HTML Tags 會移除文字中的所有 HTML 標記,並以純文字形式回傳可見內容。它能處理開始與結束標籤、屬性、自閉合標籤、註解與巢狀結構。可選行為包含解碼常見的 HTML 實體(&、©、€)、在區塊層級標籤與 br 元素處保留換行,以及完全移除 script 與 style 區塊,避免其內容洩漏到輸出中。

    常見的開發者使用情境

    使用 Strip HTML Tags 可將富文字電子郵件或 CMS 內容轉為純文字,用於 SMS 摘要;在將抓取的 HTML 存入搜尋索引前先行清理;擷取文章的可讀內容以進行摘要;或在從已渲染的網頁複製後清理剪貼簿資料。當你需要從正式環境的 HTML 頁面製作測試夾具、且只在乎文字內容時,它也很有幫助。

    資料格式、型別或變體

    輸入可以是任何 HTML 或帶有 XML 風格的標記;輸出為純 UTF-8 文字。像 € 與 € 這類數值實體參照會解碼為對應的 Unicode 字元,並支援大量命名實體(&、<、>、"、'、 、©、®、™、…、—、–、智慧引號)。當啟用保留換行時,p、div、li、h1–h6、br 以及其他區塊層級元素的結束標籤會轉為換行,連續的空白行會折疊為單一空白行。

    常見陷阱與邊界情況

    在處理惡意輸入時,基於正規表示式的 HTML 去除並不能取代真正的 HTML 解析器——不應用來清理不受信任的 HTML 後再注入到其他地方。標記不完整、標籤不匹配可能會產生出乎意料的空白。內嵌的 base64 圖片、包含看起來像標籤字串的腳本,以及 CDATA 區段都有各自的邊界情況。若要在伺服器端進行正式環境的清理,請改用經過實戰驗證的函式庫,例如 DOMPurify、sanitize-html 或 bleach。

    何時使用此工具 vs 程式碼

    當你需要一次性把一段 HTML 轉成純文字時——例如清理抓取的頁面或複製的電子郵件內文——請使用此瀏覽器工具。在應用程式程式碼中,建議使用專用函式庫:用 DOMPurify 做清理、用 html-to-text 或 htmlparser2 做結構化文字擷取,而當你需要走訪 DOM 時使用 Cheerio 或 jsdom。相較於單純跑一次正規表示式,這些函式庫能更穩健地處理巢狀表格、編碼宣告與條件式註解等邊界情況。