Enlèvement des balises HTML
Ce que ce démonteur de balises HTML fait
Il supprime les étiquettes de support d'angle comme<p>,<div>ou<span>, laissant le contenu textuel derrière—utile pour décharger des extraits lisibles dans des tableurs ou des aperçus de longueur SMS. C'est vrai.pasdécoder automatiquement les entités, neutraliser les URL de script ou imposer une licencieList – ces tâches appartiennent à des sanitizers dédiés tels que DOMPurify sur des clients ou des bibliothèques éprouvées sur des serveurs.
Quand l'utiliser
Utilisez-le lorsque les éditeurs collent du HTML riche dans des champs qui n'acceptent que le texte simple, lorsque vous diff exportez CMS, ou lorsque l'analyse a besoin de titres dépouillés de balisage pour la cardinalité compte. Pour les éviers sensibles à la sécurité, ne comptez jamais sur le décapage d'étiquettes seul. Suivre avecConvertisseur d'entités HTMLsi vous avez également besoin&résolu, et avecMarquage vers HTMLquand la source était Markdown mais vous avez besoin du texte final sans tags.
Exemple travaillé
Une exportation CSV comprend<strong>Amount due</strong>dans une colonne Power BI ne peut pas résumer. Strip tags pour le flux graphique tout en conservant une colonne séparée avec le HTML original pour la facture PDF.
Foire aux questions
Est-ce qu'il supprimera les styles inline?
La balise s'en va; le texte de l'attribut style peut laisser des résidus selon l'implémentation — tester avec votre entrée exacte.
Qu'en est-il du contenu <script>?
Le stripping peut laisser le texte du corps du script s'il n'est pas manipulé avec soin. Utilisez un véritable désinfectant pour laisser tomber les nœuds dangereux.
Des tables et des pauses ?
L'élimination pure peut mash cellules ensemble. Pour les données structurées, analyser les DOM et émettre des délimiteurs explicitement.