Hapus Tag HTML
Masukan HTML
Output Teks Biasa
Detail teknis
Cara Kerja Alat Strip Tag HTML
Apa yang Dilakukan Alat Ini
Strip HTML Tags menghapus semua markup HTML dari teks dan mengembalikan konten yang terlihat sebagai teks biasa. Alat ini menangani tag pembuka dan penutup, atribut, tag self-closing, komentar, dan struktur bersarang. Perilaku opsional mencakup mendekode entitas HTML umum (&, ©, €), mempertahankan pemisah baris pada tag tingkat blok dan elemen br, serta menghapus blok script dan style sepenuhnya agar isinya tidak ikut bocor ke output.
Kasus Penggunaan Umum untuk Developer
Gunakan Strip HTML Tags untuk mengonversi email rich-text atau konten CMS menjadi teks biasa untuk ringkasan SMS, menyanitasi HTML hasil scraping sebelum menyimpannya ke indeks pencarian, mengekstrak konten artikel yang dapat dibaca untuk peringkasan, atau membersihkan data clipboard setelah menyalin dari halaman web yang dirender. Ini juga membantu saat menyiapkan fixture pengujian dari halaman HTML produksi ketika hanya konten teks yang penting.
Format Data, Tipe, atau Varian
Input dapat berupa markup HTML apa pun atau markup bergaya XML; output adalah teks UTF-8 biasa. Referensi entitas numerik seperti € dan € didekode menjadi karakter Unicode-nya, dan beragam entitas bernama (&, <, >, ", ', , ©, ®, ™, …, —, –, smart quotes) didukung. Saat pelestarian pemisah baris diaktifkan, tag penutup untuk p, div, li, h1–h6, br, dan elemen tingkat blok lainnya menjadi baris baru dan baris kosong berturut-turut diringkas menjadi satu baris kosong.
Kesalahan Umum dan Kasus Tepi
Penghapusan HTML berbasis regex bukan pengganti parser HTML yang sesungguhnya saat menangani input berbahaya — ini tidak boleh digunakan untuk menyanitasi HTML yang tidak tepercaya sebelum disuntikkan kembali ke tempat lain. Markup yang rusak dengan tag yang tidak cocok dapat menghasilkan spasi putih yang mengejutkan. Gambar base64 yang disematkan, skrip yang berisi string yang terlihat seperti tag, dan bagian CDATA semuanya memiliki edge case. Untuk sanitasi produksi sisi server, gunakan pustaka yang sudah teruji seperti DOMPurify, sanitize-html, atau bleach.
Kapan Menggunakan Alat Ini vs Kode
Gunakan alat browser ini ketika Anda membutuhkan konversi sekali jalan dari potongan HTML menjadi teks biasa — misalnya membersihkan halaman hasil scraping atau isi email yang disalin. Dalam kode aplikasi, pilih pustaka yang memang dibuat untuk tujuan tersebut: DOMPurify untuk sanitasi, html-to-text atau htmlparser2 untuk ekstraksi teks terstruktur, dan Cheerio atau jsdom ketika Anda perlu menelusuri DOM. Pustaka-pustaka ini menangani edge case seperti tabel bersarang, deklarasi encoding, dan komentar kondisional dengan lebih tangguh dibandingkan pemrosesan regex.