Convertisseur d'entités HTML

Ce que fait ce convertisseur d'entités HTML

Encodertourne les caractères littéraux comme<,>,&, ou des guillemets dans des références d'entité afin qu'ils puissent vivre en toute sécurité à l'intérieur des nœuds de texte HTML ou XML si nécessaire.Décoderinverses nommés (&amp;), décimal, et les références hex retour en caractères Unicode. Contexte : l'attribut qui s'échappe diffère de l'encastrement de script ; cet outil gère les transformations de chaîne, pas un pipeline complet de sanitizer XSS.

Quand l'utiliser

Utilisez-le lorsque CMS exporte des apostrophes double-évasion, lorsque les lecteurs RSS affichent des entités brutes, ou lorsque vous migrez les bases de données existantes qui stockaient des blobs codés en HTML. Après la conversion, exécutez toujours des sanators de confiance pour l'utilisateur HTML — jamaisinnerHTMLsortie non fiable basée uniquement sur le basculement de l'entité. Paire avecEnlèvement des balises HTMLquand vous avez besoin de texte clair, et avecMarquage vers HTMLlors de l'établissement d'un marquage mixte.

Exemple travaillé

Un flux de traduction est imprimé&mdash;littéralement sur le site. Le décodage de la chaîne stockée révèle les entités préencodées de CMS enregistrées en amont pendant que votre rendeur est à nouveau encodé. Normaliser les règles de stockage une fois au lieu de patch-fixing par localité.

Foire aux questions

L'encodage rend-il le texte sûr ?

Seulement pour la couche que vous ciblez. Les contextes JavaScript, URL et CSS ont besoin de différentes tables d'évasion.

Des entités numériques contre des noms ?

Les deux représentent des points de code Unicode. Les entités nommées ont besoin d'une connaissance DTD en XML strict; le numérique fonctionne toujours si autorisé.

Pourquoi décoder mangles emoji ?

Les paires de substitution ou les sources mixtes UTF-8/Latin-1 peuvent avoir besoin d'une normalisation du charset avant le travail de l'entité.

Outils connexes

Outils populaires