DevToys Web Pro iconDevToys Web ProBlog
Beri nilai kami:
Coba ekstensi browser:

Hapus Tag HTML

10 tag dihapus245 karakter dihapus

Masukan HTML

  • Output Teks Biasa

  • Detail teknis

    Cara Kerja Alat Strip Tag HTML

    Apa yang Dilakukan Alat Ini

    Strip HTML Tags menghapus semua markup HTML dari teks dan mengembalikan konten yang terlihat sebagai teks biasa. Alat ini menangani tag pembuka dan penutup, atribut, tag self-closing, komentar, dan struktur bersarang. Perilaku opsional mencakup mendekode entitas HTML umum (&, ©, €), mempertahankan pemisah baris pada tag tingkat blok dan elemen br, serta menghapus blok script dan style sepenuhnya agar isinya tidak ikut bocor ke output.

    Kasus Penggunaan Umum untuk Developer

    Gunakan Strip HTML Tags untuk mengonversi email rich-text atau konten CMS menjadi teks biasa untuk ringkasan SMS, menyanitasi HTML hasil scraping sebelum menyimpannya ke indeks pencarian, mengekstrak konten artikel yang dapat dibaca untuk peringkasan, atau membersihkan data clipboard setelah menyalin dari halaman web yang dirender. Ini juga membantu saat menyiapkan fixture pengujian dari halaman HTML produksi ketika hanya konten teks yang penting.

    Format Data, Tipe, atau Varian

    Input dapat berupa markup HTML apa pun atau markup bergaya XML; output adalah teks UTF-8 biasa. Referensi entitas numerik seperti € dan € didekode menjadi karakter Unicode-nya, dan beragam entitas bernama (&, <, >, ", ',  , ©, ®, ™, …, —, –, smart quotes) didukung. Saat pelestarian pemisah baris diaktifkan, tag penutup untuk p, div, li, h1–h6, br, dan elemen tingkat blok lainnya menjadi baris baru dan baris kosong berturut-turut diringkas menjadi satu baris kosong.

    Kesalahan Umum dan Kasus Tepi

    Penghapusan HTML berbasis regex bukan pengganti parser HTML yang sesungguhnya saat menangani input berbahaya — ini tidak boleh digunakan untuk menyanitasi HTML yang tidak tepercaya sebelum disuntikkan kembali ke tempat lain. Markup yang rusak dengan tag yang tidak cocok dapat menghasilkan spasi putih yang mengejutkan. Gambar base64 yang disematkan, skrip yang berisi string yang terlihat seperti tag, dan bagian CDATA semuanya memiliki edge case. Untuk sanitasi produksi sisi server, gunakan pustaka yang sudah teruji seperti DOMPurify, sanitize-html, atau bleach.

    Kapan Menggunakan Alat Ini vs Kode

    Gunakan alat browser ini ketika Anda membutuhkan konversi sekali jalan dari potongan HTML menjadi teks biasa — misalnya membersihkan halaman hasil scraping atau isi email yang disalin. Dalam kode aplikasi, pilih pustaka yang memang dibuat untuk tujuan tersebut: DOMPurify untuk sanitasi, html-to-text atau htmlparser2 untuk ekstraksi teks terstruktur, dan Cheerio atau jsdom ketika Anda perlu menelusuri DOM. Pustaka-pustaka ini menangani edge case seperti tabel bersarang, deklarasi encoding, dan komentar kondisional dengan lebih tangguh dibandingkan pemrosesan regex.