Partager via


Choisissez une technologie de traitement du langage ciblé Azure AI

Les services Azure AI aident les développeurs et les organisations à créer rapidement des applications intelligentes, à la pointe de la technologie, prêtes à être commercialisées et responsables, grâce à des API et des modèles prêts à l'emploi, prédéfinis et personnalisables.

Cet article traite des services d’IA qui fournissent des fonctionnalités de traitement du langage ciblées, telles que le traitement du langage naturel (NLP), l’analyse de texte, la compréhension linguistique, la traduction et l’extraction de données de document. Le langage d’IA Microsoft Azure est l’une des catégories les plus larges de services d’IA. Vous pouvez utiliser les API dans votre charge de travail pour incorporer des fonctionnalités de langage telles que la reconnaissance d’entités nommées (NER), l’analyse des sentiments, la détection de la langue et la synthèse de texte.

Prestations

Les services suivants fournissent des capacités de traitement du langage ciblées pour les services d’IA :

  • Le langage fournit le NLP pour l’analyse de texte.

    • Utiliser Langue lorsque vous devez travailler avec des documents structurés ou non structurés pour le large éventail de tâches liées à la langue décrites dans cet article.

    • Ne pas utiliser Langue si vous avez besoin de rechercher des documents avec le chat, de vérifier leur sécurité de contenu ou de les traduire.

  • Microsoft Azure AI Translator est un service de traduction automatique. Il peut effectuer des traductions de texte en temps réel, des traductions de documents par lots et à fichier unique, ainsi que des traductions personnalisées que vous pouvez utiliser pour incorporer une terminologie spécialisée ou un langage spécifique à votre secteur d’activité pour votre scénario. Translator prend en charge plusieurs langues.

    • Utiliser Traducteur lorsque vous devez effectuer une traduction spécifique. Vous pouvez utiliser d’autres modèles de langage de base à usage général pour effectuer la traduction. Mais l’utilisation de Translator à des fins spécialisées peut s’avérer plus efficace et plus rentable en raison de ses modèles de traduction ciblés.

    • Ne pas utiliser Traducteur si vous avez besoin d’interagir avec le chat, d’analyser le contenu pour les sentiments ou de modérer le contenu. Pour l’analyse des sentiments, utilisez plutôt Langue. Pour la modération du contenu, utilisez Microsoft Azure AI Content Safety.

  • Azure AI Document Intelligence est un service qui peut convertir des images directement en formulaires électroniques. Vous pouvez spécifier les champs attendus, puis rechercher les images que vous fournissez pour capturer ces champs sans intervention humaine. Document Intelligence héberge de nombreux modèles prédéfinis et vous permet également de créer vos propres modèles personnalisés.

    • Utiliser Document Intelligence lorsque vous savez exactement quels champs vous devez extraire des documents numérisés pour remplir les formulaires électroniques de manière appropriée.

    • Utiliser Document Intelligence pour identifier les structures clés, telles que les en-têtes, les pieds de page et les sauts de chapitre, dans diverses collections de documents afin d’interagir davantage avec le document de manière programmatique, par exemple dans le cadre d’une implémentation de génération augmentée de récupération (RAG).

    • Ne pas utiliser Document Intelligence en tant qu’API de recherche en temps réel.

Azure OpenAI dans les modèles de Foundry

Azure OpenAI dans Foundry Models offre un accès à l'API REST aux modèles de langage puissants d'OpenAI. Ces modèles incluent O3-Mini, O1, O1-Mini, GPT-4o, GPT-4o Mini, GPT-4 Turbo avec Vision, GPT-4, GPT-3.5-Turbo et la série de modèles Embeddings. Ces modèles sont très adaptables, ce qui vous permet de les adapter à des tâches telles que la génération de contenu, la synthèse, l’analyse d’images et la recherche sémantique. Ils prennent également en charge la traduction du langage naturel en code, ce qui les rend polyvalents pour diverses applications.

Fonctionnalités

Le tableau suivant fournit la liste des fonctionnalités disponibles dans Azure OpenAI.

Capacité Descriptif
Génération et complétion de texte Génère un texte de type humain basé sur des invites, complète automatiquement des phrases ou des paragraphes, résume de longs documents en résumés concis et répond aux questions en fonction du contexte.
Bavarder Créez des chatbots et des assistants virtuels, maintenez le contexte dans les conversations à plusieurs tours et personnalisez les réponses en fonction de l’interaction de l’utilisateur.
Assistants Créez une expérience de type copilote qui conserve une personnalité cohérente à travers les interactions avec l’utilisateur. Permettez l’utilisation simultanée de plusieurs outils, tels que l’implémentation de code et la recherche de connaissances.
Incorporations Convertissez du texte en vecteurs numériques où des significations similaires sont positionnées à proximité les unes des autres dans l’espace vectoriel. Ce processus permet une recherche de similarité puissante dans des services tels qu’Azure AI Search, Azure Cosmos DB, Azure SQL Database et Azure Database pour PostgreSQL.
Filtrage du contenu Filtre à la fois les entrées de l’utilisateur et les sorties de l’IA à la recherche de contenus nuisibles dans des catégories telles que la haine, le contenu sexuel, la violence et l’automutilation, avec prise en charge de plusieurs langues. Il surveille également les modèles d’utilisation pour garantir la conformité.
Personnalisation LLM Fournit des techniques d’adaptation du modèle, y compris l’ingénierie rapide pour des ajustements rapides, le RAG pour l’intégration d’informations externes et la mise au point pour entraîner le modèle sur des tâches spécialisées. Vous pouvez combiner ces méthodes pour optimiser les performances pour des cas d’utilisation spécifiques.

Langue

Language est un service basé sur le cloud qui fournit des fonctionnalités NLP pour la compréhension et l’analyse de texte. Utilisez ce service pour créer des applications intelligentes à l’aide du Language Studio basé sur le Web, des API REST et des bibliothèques clientes.

Fonctionnalités

Le tableau suivant fournit une liste des fonctionnalités disponibles dans la langue.

Capacité Descriptif
Réponses à des questions personnalisées Recherche la réponse la plus appropriée pour les entrées de vos utilisateurs. Il est couramment utilisé pour créer des applications clientes conversationnelles, telles que des applications de médias sociaux, des chatbots et des applications de bureau vocales.
Classification de texte personnalisée Crée des modèles d’IA personnalisés pour classer les documents texte non structurés dans des classes personnalisées que vous définissez.
Compréhension du langage courant (CLU) Créez des modèles personnalisés de compréhension du langage naturel pour prédire l’intention globale d’un message entrant et en extraire des informations importantes.
Liaison d’entités Désambiguïse l’identité des mots ou des phrases trouvés dans le texte non structuré et renvoie les liens vers Wikipédia.
Détection de langue Détecte la langue dans laquelle un document est écrit et renvoie un code de langue pour un large éventail de langues, de variantes, de dialectes et de certaines langues régionales ou culturelles.
Extraction de phrases clés Évalue et renvoie les principaux concepts dans un texte non structuré et les renvoie sous forme de liste.
NER Catégorise les mots ou les expressions dans le texte non structuré dans plusieurs groupes de catégories prédéfinis, tels que les personnes, les événements, les lieux et les dates.
Workflow d’orchestration Permet de connecter CLU.
Identification personnelle des informations (PII) et détection des informations d’identification personnelle de la santé Identifie, catégorise et caviarde des informations sensibles dans les documents texte non structurés et les transcriptions de conversations, telles que les numéros de téléphone, les adresses e-mail et les formes d’identification. Pour plus d’informations, consultez Catégories d’entités PII prises en charge.
Analyse des sentiments et exploration des opinions Vous aide à comprendre ce que les gens pensent de votre marque ou de votre sujet en analysant le texte à la recherche de signes de sentiment positif ou négatif et en les reliant à des aspects spécifiques du contenu.
Résumé Utilise le résumé de texte extractif pour produire un résumé des documents et des transcriptions de conversation. Elle extrait des phrases qui représentent collectivement les informations les plus importantes ou pertinentes dans le contenu d’origine.
Analyse de texte pour la santé Extrait et étiquette les informations médicales pertinentes à partir de textes non structurés, tels que les notes du médecin, les bilans de sortie, les documents cliniques et les dossiers de santé électroniques. Lorsque vous concevez votre charge de travail, évaluez l’emplacement de traitement et la résidence des données de cette fonctionnalité hébergée dans le cloud pour vous assurer qu’elle correspond à vos attentes en matière de conformité. Certaines charges de travail peuvent être limitées dans leur capacité à envoyer des données de santé à une plateforme hébergée dans le cloud. Vous pouvez utiliser cette API en tant que conteneur Docker pour héberger votre propre calcul dans le cloud ou localement. Ce processus peut aider à résoudre les problèmes de conformité qui incluent la plateforme en tant que service. Pour plus d’informations, consultez Utiliser l’analyse de texte pour les conteneurs d’intégrité.

Cas d’utilisation

Le tableau suivant fournit une liste de cas d’utilisation possibles pour Language.

Cas d’usage Personnalisable
Prédisez l’intention des entrées utilisateur et extrayez-en des informations. Oui
Identifiez et caviardez les informations sensibles telles que les PII.
Identifiez la langue dans laquelle un texte a été écrit.
Extrayez des informations médicales de documents cliniques ou médicaux sans construire de modèle.
Extrayez des informations médicales de documents cliniques ou médicaux à l’aide d’un modèle formé sur vos données. Oui
Extrayez des catégories d’informations sans créer de modèle personnalisé.
Extrayez des catégories d’informations à l’aide d’un modèle spécifique à vos données. Oui
Extrayez les rubriques principales et les expressions importantes.
Résumez un document.
Classifier du texte en utilisant l’analyse des sentiments. Oui
Classifier du texte à l’aide de classes personnalisées. Oui
Classifiez les éléments en catégories fournies au moment de l’inférence.
Lier une entité à des articles de base de connaissances.
Comprendre des questions et des réponses (génériques). Oui
Créer une application conversationnelle qui répond aux entrées utilisateur.
Connectez les applications à partir de CLU et répondez aux questions. Oui

Si une fonctionnalité est personnalisable, vous pouvez entraîner un modèle d’IA en utilisant nos outils pour l’adapter à vos données spécifiques. Sinon, la fonctionnalité est préconfigurée, ce qui signifie que ses modèles d’IA restent inchangés. Vous fournissez vos données et utilisez la sortie de la fonctionnalité dans vos applications.

Traducteur

Translator est un service de traduction automatique qui fait partie des services d’IA. Traducteur alimente de nombreux produits et services Microsoft.

Fonctionnalités

Le tableau suivant fournit la liste des fonctionnalités disponibles dans Translator.

Capacité Descriptif
Traduction de texte Azure Effectuez en temps réel la traduction de texte entre les langues source et cible prises en charge. Créez un dictionnaire dynamique et découvrez comment empêcher les traductions à l’aide de l’API Translator.
Traduction de documents Traduction par lots asynchrone : Traduisez des fichiers complexes et par lots tout en préservant la structure et le format des documents originaux. Le processus de traduction par lots nécessite un compte de stockage Blob Azure qui contient des conteneurs pour vos documents sources et traduits.
Traduction synchrone d’un seul fichier : Traduisez un seul fichier de document seul ou avec un fichier de glossaire tout en préservant la structure et le format du document d’origine. Le processus de traduction de fichier ne nécessite pas de compte de stockage Blob. La réponse finale contient le document traduit et est retournée directement au client appelant.
Traducteur personnalisé Créez des modèles personnalisés pour traduire le langage, la terminologie et le style spécifiques à un domaine et à une industrie. Créez un dictionnaire (groupes de mots ou phrases) pour les traductions personnalisées.

Cas d’utilisation

Le tableau suivant fournit une liste des cas d’utilisation possibles de Translator.

Cas d’usage Documentation
Traduire du texte propre à un secteur d’activité. Traducteur personnalisé
Traduire du texte générique qui n’est pas propre à un secteur d’activité. Traduction de texte Azure

Intelligence des documents

Language est un service basé sur le cloud qui fournit des fonctionnalités NLP pour la compréhension et l’analyse de texte. Utilisez ce service pour créer des applications intelligentes à l’aide du Language Studio basé sur le Web, des API REST et des bibliothèques clientes.

Fonctionnalités

Le tableau suivant fournit une liste de certaines des fonctionnalités disponibles dans Document Intelligence.

Capacité Descriptif
Extraction de carte de visite Le modèle de carte de visite Document Intelligence combine des capacités de reconnaissance optique de caractères (OCR) à des modèles Deep Learning pour analyser et extraire des données à partir d’images de cartes de visite. L’API analyse les cartes de visite imprimées, extrait des informations clés telles que le prénom, le nom, le nom de l’entreprise, l’adresse e-mail et le numéro de téléphone, puis renvoie une représentation structurée des données JSON.
Extraction d’un modèle de contrat Le modèle de contrat Document Intelligence utilise les fonctionnalités d’OCR pour analyser et extraire les champs clés et les postes d’un groupe sélectionné d’entités contractuelles importantes. Les contrats peuvent être de différents formats et de différentes qualités, y compris des images capturées par téléphone, des documents numérisés et des PDF numériques. L’API analyse le texte du document, extrait des informations clés telles que les parties, les juridictions, l’ID de contrat et le titre, puis renvoie une représentation structurée des données JSON. Le modèle prend actuellement en charge les formats de documents en anglais.
Extraction de carte de crédit Le modèle de carte de crédit/débit Document Intelligence utilise les capacités OCR pour analyser et extraire les champs clés des cartes de crédit et de débit. Les cartes de crédit et de débit peuvent apparaître dans différents formats et qualités, y compris des images capturées par téléphone, des documents numérisés et des PDF numériques. L’API analyse le texte du document, extrait des informations clés telles que le numéro de carte, la banque émettrice et la date d’expiration, puis renvoie une représentation structurée des données JSON. Le modèle prend actuellement en charge les formats de documents en anglais.
Extraction de carte d’assurance maladie Le modèle de carte d’assurance maladie Document Intelligence combine des capacités d’OCR avec des modèles d’apprentissage profond pour analyser et extraire des informations clés des cartes d’assurance maladie américaines. Une carte d’assurance maladie est un document essentiel pour la prise en charge des soins et peut être analysée numériquement pour l’intégration des patients, les informations de couverture financière, les paiements sans espèces et le traitement des revendications d’assurance. Le modèle de carte d’assurance maladie analyse les images de la carte d’assurance-maladie, extrait des informations clés telles que l’assureur, le membre, l’ordonnance et le numéro de groupe, puis renvoie une représentation JSON structurée. Les cartes d’assurance maladie peuvent apparaître dans divers formats et qualités, y compris des images capturées par téléphone, des documents numérisés et des PDF numériques.
Extraction de documents fiscaux américains Le modèle de contrat Document Intelligence utilise les fonctionnalités d’OCR pour analyser et extraire des champs clés et des postes à partir d’un groupe sélectionné de documents fiscaux. Les documents fiscaux peuvent être de différents formats et de différentes qualités, y compris des images capturées sur le téléphone, des documents numérisés et des PDF numériques. L’API analyse le texte du document, extrait des informations clés telles que le nom du client, l’adresse de facturation, la date d’échéance et le montant dû, puis renvoie une représentation structurée des données JSON. À l’heure actuelle, le modèle prend en charge certains formats de documents fiscaux en anglais.
Bibliothèques de client Document Intelligence prend en charge un large éventail de modèles qui vous permettent d’ajouter un traitement intelligent des documents à vos applications et flux. Vous pouvez utiliser un modèle spécifique au domaine prédéfini ou former un modèle personnalisé adapté à vos besoins métier et cas d’usage spécifiques. Le service Intelligence documentaire peut être utilisé avec l’API REST ou les bibliothèques de client Python, C#, Java et JavaScript.

Pour plus d’informations sur les scénarios de modèle, consultez Quel modèle dois-je choisir ?

Étapes suivantes