Partager via


Codage des caractères dans le composant de pipeline de désassemblage XML

Le désassembleur XML utilise l’algorithme suivant pour déterminer l’encodage à utiliser pour le traitement des messages entrants :

  1. Si une marque d’ordre d’octet existe dans les données, les informations d’encodage sont déterminées à partir de celle-ci.

  2. Sinon, si la propriété IBaseMessagePart.Charset est définie, l’encodage spécifié est utilisé.

  3. Sinon, si la déclaration XML est présente dans le document XML, l’encodage spécifié est utilisé, à condition que la déclaration XML soit ANSI.

  4. Sinon, l’encodage UTF-8 est utilisé.

    Pour les cas précédents 2, 3 et 4, après que le désassembleur XML détermine l’encodage, il l’enregistre sur le contexte de message dans la propriété XMLNorm.SourceCharset . Les messages générés par le composant de pipeline Désassembleur XML utilisent toujours l’encodage UTF-8. Dans le cas 1, l’encodage déterminé à partir de la marque d’ordre d’octet n’est pas conservé.

Voir aussi

Composant de pipeline XML pour le désassemblage
Guide pratique pour configurer le composant de pipeline désassembleur XML