DevToys Web Pro iconDevToys Web Proಬ್ಲಾಗ್
ನಮಗೆ ರೇಟಿಂಗ್ ನೀಡಿ:
ಬ್ರೌಸರ್ ಎಕ್ಸ್ಟೆನ್ಶನ್ ಪ್ರಯತ್ನಿಸಿ:

HTML ಟ್ಯಾಗ್‌ಗಳನ್ನು ತೆಗೆದುಹಾಕಿ

10 ಟ್ಯಾಗ್‌ಗಳನ್ನು ತೆಗೆದುಹಾಕಲಾಗಿದೆ245 ಅಕ್ಷರಗಳನ್ನು ತೆಗೆದುಹಾಕಲಾಗಿದೆ

HTML ಇನ್‌ಪುಟ್

  • ಸರಳ ಪಠ್ಯ ಔಟ್‌ಪುಟ್

  • ತಾಂತ್ರಿಕ ವಿವರಗಳು

    Strip HTML Tags ಸಾಧನ ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ

    ಈ ಸಾಧನ ಏನು ಮಾಡುತ್ತದೆ

    Strip HTML Tags ಪಠ್ಯದಿಂದ ಎಲ್ಲಾ HTML ಮಾರ್ಕಪ್ ಅನ್ನು ತೆಗೆದುಹಾಕಿ ಕಾಣುವ ವಿಷಯವನ್ನು ಸರಳ ಪಠ್ಯವಾಗಿ ಮರಳಿಸುತ್ತದೆ. ಇದು ಓಪನಿಂಗ್ ಮತ್ತು ಕ್ಲೋಸಿಂಗ್ ಟ್ಯಾಗ್‌ಗಳು, ಅಟ್ರಿಬ್ಯೂಟ್‌ಗಳು, ಸ್ವಯಂ-ಮುಚ್ಚುವ ಟ್ಯಾಗ್‌ಗಳು, ಕಾಮೆಂಟ್‌ಗಳು, ಮತ್ತು ನೆಸ್ಟೆಡ್ ರಚನೆಗಳನ್ನು ನಿರ್ವಹಿಸುತ್ತದೆ. ಐಚ್ಛಿಕ ವರ್ತನೆಗಳಲ್ಲಿ ಸಾಮಾನ್ಯ HTML ಎಂಟಿಟಿಗಳನ್ನು (&, ©, €) ಡಿಕೋಡ್ ಮಾಡುವುದು, ಬ್ಲಾಕ್-ಲೆವೆಲ್ ಟ್ಯಾಗ್‌ಗಳು ಮತ್ತು br ಎಲಿಮೆಂಟ್‌ಗಳಲ್ಲಿ ಲೈನ್ ಬ್ರೇಕ್‌ಗಳನ್ನು ಉಳಿಸುವುದು, ಮತ್ತು script ಹಾಗೂ style ಬ್ಲಾಕ್‌ಗಳನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ತೆಗೆದುಹಾಕುವುದು ಸೇರಿವೆ, ಹೀಗಾಗಿ ಅವುಗಳ ವಿಷಯ ಔಟ್‌ಪುಟ್‌ಗೆ ಲೀಕ್ ಆಗುವುದಿಲ್ಲ.

    ಡೆವಲಪರ್‌ಗಳ ಸಾಮಾನ್ಯ ಬಳಕೆ ಪ್ರಕರಣಗಳು

    Strip HTML Tags ಅನ್ನು ರಿಚ್-ಟೆಕ್ಸ್ಟ್ ಇಮೇಲ್ ಅಥವಾ CMS ವಿಷಯವನ್ನು SMS ಡೈಜೆಸ್ಟ್‌ಗಳಿಗಾಗಿ ಸರಳ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸಲು, ಸರ್ಚ್ ಇಂಡೆಕ್ಸ್‌ನಲ್ಲಿ ಸಂಗ್ರಹಿಸುವ ಮೊದಲು ಸ್ಕ್ರೇಪ್ ಮಾಡಿದ HTML ಅನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸಲು, ಸಾರಾಂಶಗೊಳಿಸುವುದಕ್ಕಾಗಿ ಲೇಖನದ ಓದಬಹುದಾದ ವಿಷಯವನ್ನು ಹೊರತೆಗೆಯಲು, ಅಥವಾ ರೆಂಡರ್ ಮಾಡಿದ ವೆಬ್ ಪುಟದಿಂದ ಕಾಪಿ ಮಾಡಿದ ನಂತರ ಕ್ಲಿಪ್‌ಬೋರ್ಡ್ ಡೇಟಾವನ್ನು ಕ್ಲೀನ್ ಅಪ್ ಮಾಡಲು ಬಳಸಿ. ಪಠ್ಯ ವಿಷಯ ಮಾತ್ರ ಮುಖ್ಯವಾಗಿರುವ ಪ್ರೊಡಕ್ಷನ್ HTML ಪುಟಗಳಿಂದ ಟೆಸ್ಟ್ ಫಿಕ್ಸ್ಚರ್‌ಗಳನ್ನು ತಯಾರಿಸುವಾಗಲೂ ಇದು ಸಹಾಯ ಮಾಡುತ್ತದೆ.

    ಡೇಟಾ ಸ್ವರೂಪಗಳು, ಪ್ರಕಾರಗಳು, ಅಥವಾ ರೂಪಾಂತರಗಳು

    ಇನ್‌ಪುಟ್ ಯಾವುದೇ HTML ಅಥವಾ XML-ಶೈಲಿಯ ಮಾರ್ಕಪ್; ಔಟ್‌ಪುಟ್ ಸರಳ UTF-8 ಪಠ್ಯ. € ಮತ್ತು € ಮುಂತಾದ ಸಂಖ್ಯಾತ್ಮಕ ಎಂಟಿಟಿ ರೆಫರೆನ್ಸ್‌ಗಳು ಅವುಗಳ Unicode ಅಕ್ಷರಗಳಿಗೆ ಡಿಕೋಡ್ ಆಗುತ್ತವೆ, ಮತ್ತು ಹೆಸರಿತ ಎಂಟಿಟಿಗಳ ವಿಶಾಲ ಸಮೂಹವನ್ನು (&, <, >, ", ',  , ©, ®, ™, …, —, –, ಸ್ಮಾರ್ಟ್ ಕ್ವೋಟ್‌ಗಳು) ಬೆಂಬಲಿಸಲಾಗುತ್ತದೆ. ಲೈನ್-ಬ್ರೇಕ್ ಉಳಿಸುವಿಕೆ ಆನ್ ಆಗಿದ್ದಾಗ, p, div, li, h1–h6, br, ಮತ್ತು ಇತರ ಬ್ಲಾಕ್-ಲೆವೆಲ್ ಎಲಿಮೆಂಟ್‌ಗಳ ಕ್ಲೋಸಿಂಗ್ ಟ್ಯಾಗ್‌ಗಳು ನ್ಯೂಲೈನ್‌ಗಳಾಗುತ್ತವೆ ಮತ್ತು ಕ್ರಮವಾಗಿ ಬರುವ ಖಾಲಿ ಸಾಲುಗಳು ಒಂದೇ ಖಾಲಿ ಸಾಲಿಗೆ ಕುಗ್ಗುತ್ತವೆ.

    ಸಾಮಾನ್ಯ ತಪ್ಪುಗಳು ಮತ್ತು ಎಡ್ಜ್ ಕೇಸ್‌ಗಳು

    ದುರುದ್ದೇಶಪೂರಿತ ಇನ್‌ಪುಟ್‌ನೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವಾಗ regex-ಆಧಾರಿತ HTML ಸ್ಟ್ರಿಪಿಂಗ್ ನಿಜವಾದ HTML ಪಾರ್ಸರ್‌ಗೆ ಪರ್ಯಾಯವಲ್ಲ — ನಂಬಲಾಗದ HTML ಅನ್ನು ಬೇರೆಡೆ ಮರುಸೇರಿಸುವ ಮೊದಲು ಸ್ಯಾನಿಟೈಸ್ ಮಾಡಲು ಇದನ್ನು ಬಳಸಬಾರದು. ಹೊಂದಿಕೆಯಾಗದ ಟ್ಯಾಗ್‌ಗಳಿರುವ ಮ್ಯಾಲ್ಫಾರ್ಮ್ಡ್ ಮಾರ್ಕಪ್ ಅಚ್ಚರಿಯ ವೈಟ್‌ಸ್ಪೇಸ್ ಅನ್ನು ಉತ್ಪಾದಿಸಬಹುದು. ಎಂಬೆಡೆಡ್ base64 ಚಿತ್ರಗಳು, ಟ್ಯಾಗ್‌ಗಳಂತೆ ಕಾಣುವ ಸ್ಟ್ರಿಂಗ್‌ಗಳನ್ನು ಹೊಂದಿರುವ ಸ್ಕ್ರಿಪ್ಟ್‌ಗಳು, ಮತ್ತು CDATA ಸೆಕ್ಷನ್‌ಗಳೆಲ್ಲವೂ ಎಡ್ಜ್ ಕೇಸ್‌ಗಳನ್ನು ಹೊಂದಿವೆ. ಸರ್ವರ್-ಸೈಡ್ ಪ್ರೊಡಕ್ಷನ್ ಸ್ಯಾನಿಟೈಜೇಶನ್‌ಗಾಗಿ DOMPurify, sanitize-html, ಅಥವಾ bleach ಮುಂತಾದ ಯುದ್ಧಪರೀಕ್ಷಿತ ಲೈಬ್ರರಿಯನ್ನು ಬಳಸಿರಿ.

    ಕೋಡ್‌ಗಿಂತ ಈ ಸಾಧನವನ್ನು ಯಾವಾಗ ಬಳಸಬೇಕು

    HTML‌ನ ಒಂದು ಭಾಗವನ್ನು ಸರಳ ಪಠ್ಯಕ್ಕೆ ಒಮ್ಮೆಲೆ ಪರಿವರ್ತನೆ ಮಾಡಬೇಕಾದಾಗ — ಉದಾ. ಸ್ಕ್ರೇಪ್ ಮಾಡಿದ ಪುಟವನ್ನು ಅಥವಾ ಕಾಪಿ ಮಾಡಿದ ಇಮೇಲ್ ಬಾಡಿಯನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸುವಾಗ — ಈ ಬ್ರೌಸರ್ ಸಾಧನವನ್ನು ಬಳಸಿ. ಅಪ್ಲಿಕೇಶನ್ ಕೋಡ್‌ನಲ್ಲಿ, ಉದ್ದೇಶ-ನಿರ್ದಿಷ್ಟ ಲೈಬ್ರರಿಗಳನ್ನು ಆದ್ಯತೆ ನೀಡಿ: ಸ್ಯಾನಿಟೈಜೇಶನ್‌ಗಾಗಿ DOMPurify, ರಚಿತ ಪಠ್ಯ ಹೊರತೆಗೆಯಲು html-to-text ಅಥವಾ htmlparser2, ಮತ್ತು DOM ಅನ್ನು ವಾಕ್ ಮಾಡಬೇಕಾದಾಗ Cheerio ಅಥವಾ jsdom. ಈ ಲೈಬ್ರರಿಗಳು ನೆಸ್ಟೆಡ್ ಟೇಬಲ್‌ಗಳು, ಎನ್‌ಕೋಡಿಂಗ್ ಡಿಕ್ಲರೇಷನ್‌ಗಳು, ಮತ್ತು ಕಂಡಿಷನಲ್ ಕಾಮೆಂಟ್‌ಗಳಂತಹ ಎಡ್ಜ್ ಕೇಸ್‌ಗಳನ್ನು regex ಪಾಸ್‌ಗಿಂತ ಹೆಚ್ಚು ದೃಢವಾಗಿ ನಿರ್ವಹಿಸುತ್ತವೆ.