DevToys Web Pro iconDevToys Web Proব্লগ
আমাদের রেট দিন:
ব্রাউজার এক্সটেনশন ব্যবহার করে দেখুন:

HTML ট্যাগ সরান

10 ট্যাগ সরানো হয়েছে245 অক্ষর সরানো হয়েছে

HTML ইনপুট

  • প্লেইন টেক্সট আউটপুট

  • প্রযুক্তিগত বিবরণ

    Strip HTML Tags টুল কীভাবে কাজ করে

    টুলটি কী করে

    Strip HTML Tags টেক্সট থেকে সব HTML মার্কআপ সরিয়ে দৃশ্যমান কনটেন্টকে প্লেইন টেক্সট হিসেবে ফেরত দেয়। এটি ওপেনিং ও ক্লোজিং ট্যাগ, অ্যাট্রিবিউট, সেল্ফ-ক্লোজিং ট্যাগ, কমেন্ট, এবং নেস্টেড স্ট্রাকচার হ্যান্ডেল করে। ঐচ্ছিক আচরণের মধ্যে আছে সাধারণ HTML entity ডিকোড করা (&, ©, €), ব্লক-লেভেল ট্যাগ ও br এলিমেন্টে লাইন ব্রেক সংরক্ষণ করা, এবং script ও style ব্লক সম্পূর্ণভাবে সরিয়ে দেওয়া যাতে তাদের কনটেন্ট আউটপুটে লিক না করে।

    ডেভেলপারদের সাধারণ ব্যবহারক্ষেত্র

    Strip HTML Tags ব্যবহার করে রিচ-টেক্সট ইমেইল বা CMS কনটেন্টকে SMS ডাইজেস্টের জন্য প্লেইন টেক্সটে রূপান্তর করুন, সার্চ ইনডেক্সে সংরক্ষণের আগে স্ক্র্যাপ করা HTML স্যানিটাইজ করুন, সারাংশ তৈরির জন্য কোনো আর্টিকেলের পাঠযোগ্য কনটেন্ট বের করুন, বা রেন্ডার করা ওয়েব পেজ থেকে কপি করার পর ক্লিপবোর্ড ডেটা পরিষ্কার করুন। প্রোডাকশন HTML পেজ থেকে টেস্ট ফিক্সচার প্রস্তুত করার সময়ও এটি সাহায্য করে, যখন শুধু টেক্সট কনটেন্টটাই গুরুত্বপূর্ণ।

    ডেটা ফরম্যাট, টাইপ বা ভ্যারিয়েন্ট

    ইনপুট হতে পারে যেকোনো HTML বা XML-ধাঁচের মার্কআপ; আউটপুট হলো প্লেইন UTF-8 টেক্সট। € এবং € এর মতো সংখ্যাসূচক entity রেফারেন্স তাদের ইউনিকোড ক্যারেক্টারে ডিকোড হয়, এবং নামযুক্ত entity-র একটি বড় সেট (&, <, >, ", ',  , ©, ®, ™, …, —, –, স্মার্ট কোটস) সাপোর্ট করা হয়। লাইন-ব্রেক সংরক্ষণ চালু থাকলে p, div, li, h1–h6, br, এবং অন্যান্য ব্লক-লেভেল এলিমেন্টের ক্লোজিং ট্যাগগুলো নিউলাইন হয়ে যায় এবং পরপর একাধিক খালি লাইন একটিমাত্র খালি লাইনে সংকুচিত হয়।

    সাধারণ ভুল ও এজ কেস

    দুর্বৃত্ত ইনপুট নিয়ে কাজ করার সময় regex-ভিত্তিক HTML স্ট্রিপিং কোনো বাস্তব HTML পার্সারের বিকল্প নয় — অবিশ্বস্ত HTML স্যানিটাইজ করে পরে অন্য কোথাও পুনরায় ইনজেক্ট করার জন্য এটি ব্যবহার করা উচিত নয়। মিসম্যাচড ট্যাগসহ বিকৃত মার্কআপ অপ্রত্যাশিত হোয়াইটস্পেস তৈরি করতে পারে। এমবেডেড base64 ইমেজ, ট্যাগের মতো দেখতে স্ট্রিং থাকা স্ক্রিপ্ট, এবং CDATA সেকশন—সবগুলোরই এজ কেস আছে। সার্ভার-সাইড প্রোডাকশন স্যানিটাইজেশনের জন্য DOMPurify, sanitize-html, বা bleach-এর মতো যুদ্ধপরীক্ষিত লাইব্রেরি ব্যবহার করুন।

    কোডের বদলে কখন এই টুল ব্যবহার করবেন

    HTML-এর কোনো অংশকে একবারে প্লেইন টেক্সটে রূপান্তর করতে হলে এই ব্রাউজার টুলটি ব্যবহার করুন — যেমন স্ক্র্যাপ করা পেজ বা কপি করা ইমেইল বডি পরিষ্কার করা। অ্যাপ্লিকেশন কোডে উদ্দেশ্য-নির্দিষ্ট লাইব্রেরি প্রাধান্য দিন: স্যানিটাইজেশনের জন্য DOMPurify, স্ট্রাকচার্ড টেক্সট এক্সট্র্যাকশনের জন্য html-to-text বা htmlparser2, এবং DOM ট্রাভার্স করতে হলে Cheerio বা jsdom। এই লাইব্রেরিগুলো নেস্টেড টেবিল, এনকোডিং ডিক্লারেশন, এবং কন্ডিশনাল কমেন্টের মতো এজ কেসগুলো regex পাসের চেয়ে বেশি দৃঢ়ভাবে হ্যান্ডেল করে।