DevToys Web Pro iconDevToys Web Proብሎግ
ደረጃ ይስጡን፦
የአሳሽ ቅጥያን ይሞክሩ፦

የHTML መለያዎችን አስወግድ

10 መለያዎች ተወግደዋል245 ቁምፊዎች ተወግደዋል

የHTML ግቤት

  • የቀላል ጽሑፍ ውጤት

  • ቴክኒካዊ ዝርዝሮች

    የHTML መለያዎችን ማስወገድ መሣሪያ እንዴት እንደሚሰራ

    መሣሪያው ምን ያደርጋል

    Strip HTML Tags ከጽሑፍ ውስጥ ሁሉንም የHTML ማርክአፕ ያስወግዳል እና የሚታየውን ይዘት እንደ ቀላል ጽሑፍ ይመልሳል። የመክፈቻ እና የመዝጊያ መለያዎችን፣ አትሪቢዩቶችን፣ ራስ-የሚዘጉ መለያዎችን፣ አስተያየቶችን እና የተደራረቡ መዋቅሮችን ይያዛል። አማራጭ ባህሪያት የተለመዱ የHTML ኤንቲቲዎችን መፍታት (&, ©, €)፣ በብሎክ-ደረጃ መለያዎች እና br ኤለመንቶች ላይ የመስመር መቋረጦችን መጠበቅ፣ እና script እና style ብሎኮችን ሙሉ በሙሉ ማስወገድ ያካትታሉ እንዲሁም ይዘታቸው ወደ ውጤቱ እንዳይፈስ ያደርጋል።

    የተለመዱ የገንቢ አጠቃቀም ሁኔታዎች

    Strip HTML Tags ን በመጠቀም የሪች-ቴክስት ኢሜይል ወይም የCMS ይዘትን ለSMS ማጠቃለያዎች ወደ ቀላል ጽሑፍ ይቀይሩ፣ የተሰበሰበ (scraped) HTML ከፍለጋ መረጃ ጠቋሚ ውስጥ ከማከማቸት በፊት ያጽዱ፣ ለማጠቃለያ የጽሑፍ አንቀጽ የሚነበብ ይዘት ያውጡ፣ ወይም ከተቀረጸ ድረ-ገጽ ላይ ከተቀዳ በኋላ የክሊፕቦርድ ውሂብን ያጽዱ። እንዲሁም ከምርት የHTML ገጾች የሙከራ ፊክስቸሮችን ሲያዘጋጁ ጽሑፋዊ ይዘት ብቻ ሲያስፈልግ ይረዳል።

    የውሂብ ቅርጾች፣ አይነቶች ወይም ልዩነቶች

    ግቤት ማንኛውም የHTML ወይም የXML-ዓይነት ማርክአፕ ነው፤ ውጤት ግን ቀላል UTF-8 ጽሑፍ ነው። እንደ € እና € ያሉ የቁጥር ኤንቲቲ ማጣቀሻዎች ወደ ዩኒኮድ ቁምፊዎቻቸው ይፈታሉ፣ እና ሰፊ የተሰየመ ኤንቲቲዎች ስብስብ (&, <, >, ", ',  , ©, ®, ™, …, —, –, smart quotes) ይደገፋል። የመስመር-መቋረጥ ጥበቃ ሲነቃ፣ ለ p, div, li, h1–h6, br እና ሌሎች የብሎክ-ደረጃ ኤለመንቶች የመዝጊያ መለያዎች አዲስ መስመሮች ይሆናሉ እና ተከታታይ ባዶ መስመሮች ወደ አንድ ባዶ መስመር ይጠበቃሉ።

    የተለመዱ ስህተቶች እና የጠርዝ ሁኔታዎች

    በሬጅክስ-መሠረት የHTML ማስወገድ ክፉ ግቤት ሲኖር እውነተኛ የHTML ፓርሰርን አይተካም — ያልታመነ HTML ከማጽዳት በፊት እና በሌላ ቦታ እንደገና ለማስገባት መጠቀም የለበትም። ያልተሟላ ማርክአፕ ከማይዛመዱ መለያዎች ጋር ያልተጠበቀ ነጭ ቦታ ሊያመነጭ ይችላል። የተካተቱ base64 ምስሎች፣ መለያዎችን የሚመስሉ ሕብረቁምፊዎች ያሉባቸው ስክሪፕቶች፣ እና CDATA ክፍሎች ሁሉም የጠርዝ ጉዳዮች አሏቸው። ለሰርቨር-ወገን የምርት ማጽዳት በምትኩ DOMPurify, sanitize-html, ወይም bleach ያሉ በጥልቅ የተፈተኑ ቤተ-መጻሕፍትን ይጠቀሙ።

    ይህን መሣሪያ ከኮድ ጋር መቼ መጠቀም እንደሚገባ

    የHTML ክፍልን ወደ ቀላል ጽሑፍ አንድ-ጊዜ ለመቀየር ሲፈልጉ — ለምሳሌ የተሰበሰበ ገጽ ማጽዳት ወይም የተቀዳ የኢሜይል አካል — ይህን የአሳሽ መሣሪያ ይጠቀሙ። በመተግበሪያ ኮድ ውስጥ ግን ለዓላማው የተሠሩ ቤተ-መጻሕፍትን ይመርጡ፦ ለማጽዳት DOMPurify፣ ለተዋቀረ ጽሑፍ ማውጣት html-to-text ወይም htmlparser2፣ እና DOM ለመጓዝ ሲፈልጉ Cheerio ወይም jsdom። እነዚህ ቤተ-መጻሕፍቶች እንደ ተደራረቡ ሰንጠረዦች፣ የኢንኮዲንግ መግለጫዎች እና የሁኔታዊ አስተያየቶች ያሉ የጠርዝ ጉዳዮችን ከሬጅክስ ማለፊያ ይልቅ ይበልጥ ጠንካራ ሁኔታ ይያዛሉ።