Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette page présente AI/BI Genie, une fonctionnalité Azure Databricks qui permet aux équipes d’entreprise d’interagir avec leurs données à l’aide du langage naturel. Il utilise l’IA générative adaptée à la terminologie et aux données de votre organisation, avec la possibilité de surveiller et d’affiner ses performances par le biais des commentaires des utilisateurs.
Vue d’ensemble
Les experts du domaine, notamment les analystes de données, configurent les espaces Genie avec des jeux de données, des exemples de requêtes et des directives textuelles afin d’aider Genie à traduire les questions professionnelles en requêtes analytiques. Après la configuration, les utilisateurs professionnels peuvent poser des questions et générer des visualisations pour comprendre les données opérationnelles. Vous pouvez mettre à jour en permanence les connaissances sémantiques de Genie à mesure que vos données changent et que les utilisateurs posent de nouvelles questions. Pour plus d’informations sur les fonctionnalités basées sur l’IA Databricks, consultez les fonctionnalités d’assistance d’IA Databricks.
AI/BI Genie sélectionne les noms et descriptions pertinents dans les tables et colonnes annotées pour convertir les questions en langage naturel en requête SQL équivalente. Ensuite, il répond avec la requête générée et la table de résultats, si possible. Si Genie ne peut pas générer de réponse, il peut poser des questions de suivi pour clarifier avant de fournir une réponse.
Exemples de cas d’utilisation
Vous pouvez créer différents espaces Génie pour servir différents publics non techniques. Les scénarios suivants décrivent deux cas d’usage possibles.
Exemple 1 : Visualiser l’état des opportunités
Un responsable des ventes souhaite obtenir l’état actuel des opportunités ouvertes et fermées par phase dans son pipeline de ventes. Il peut interagir avec l’espace Genie en utilisant du langage naturel et générer automatiquement une visualisation.
Le GIF suivant montre cette interaction :
Exemple 2 : Suivi de la logistique
Une société de logistique veut utiliser des espaces Genie pour aider les utilisateurs métier de différents départements à suivre les informations opérationnelles et financières. Ils ont mis en place un espace Genie pour que leurs gestionnaires d’installations d’expédition puissent suivre les expéditions et un autre pour que leurs cadres financiers puissent comprendre leur situation financière.
Quelles données dois-je utiliser ?
Un espace Génie est basé sur les données inscrites dans le catalogue Unity, notamment les tables gérées, les tables externes, les tables étrangères, les vues, les vues métriques et les vues matérialisées. AI/BI Genie utilise les métadonnées attachées aux objets catalogue Unity, ainsi qu’une base de connaissances au niveau de l’espace organisée par l’auteur, pour générer des réponses. Des jeux de données annotés correctement, associés à des instructions spécifiques que vous fournissez, sont essentiels pour la création d’une expérience positive pour les utilisateurs finaux.
Chargements de fichiers
Importante
Cette fonctionnalité est disponible en préversion publique.
Les chargements de fichiers permettent aux utilisateurs de fusionner leurs fichiers CSV et Excel locaux avec les données du catalogue Unity pour répondre aux questions. Pour activer les chargements de fichiers, contactez votre équipe de compte Databricks. Pour plus d’informations, consultez Charger un fichier.
Fonctionnement de Genie
Genie utilise un système d’IA composé pour interpréter les questions métier et générer des réponses. Au lieu d’utiliser un seul modèle de langage volumineux, les systèmes IA composés traitent les tâches dans les applications IA en combinant plusieurs composants interagissants. Les systèmes IA composés sont un modèle de conception de plus en plus courant pour les applications IA en raison de leurs performances et de leur flexibilité. Pour plus d’informations, consultez The Shift from Models to Compound AI Systems.
Assistance linguistique
Vous pouvez utiliser Genie dans des langues autres que l’anglais, comme le portugais et le français. Toutefois, le cadre d’agent sous-jacent encapsule les instructions en anglais.
Databricks recommande aux créateurs d’espace d’ajouter autant de métadonnées que possible dans leur langage de choix. Les réponses génie peuvent parfois apparaître en anglais en raison des invites système sous-jacentes.
Qu’est-ce que la base de connaissances de Genie ?
La base de connaissances de Genie permet aux auteurs de :
Modifiez les métadonnées localement : Les auteurs génie peuvent ajouter des métadonnées spécifiques à l’espace aux ressources de données. Par exemple, il peut inclure des informations spécifiques à l’entreprise relatives à la façon dont l’espace est utilisé. Cela inclut les descriptions des métadonnées de table et de colonne, les synonymes au niveau des colonnes, les valeurs échantillonnée et les dictionnaires de valeurs, que Genie consulte lors de la génération de réponses. Une couche de métadonnées détaillée permet à Genie de récupérer les informations correctes et de produire des résultats plus précis.
Fournissez des instructions structurées et affinées : Les auteurs peuvent définir des relations entre des tables pour apprendre JOIN à créer SQL sur plusieurs tables.
Consultez Créer une base de connaissances pour obtenir des espaces Génie plus fiables.
Comment Genie génère-t-il une réponse ?
Lorsqu’un utilisateur envoie une question, Genie analyse la demande, identifie les sources de données pertinentes et détermine comment générer une réponse appropriée. Les détails fournis par les auteurs, combinés à des commentaires, métadonnées et exemples de valeurs de catalogue Unity pertinents à partir de colonnes sélectionnées, permettent à Genie de déduire à la fois la logique métier et technique. Pour plus d’informations, consultez les fonctionnalités d'assistance de l'IA de Databricks relatives à la confiance et à la sécurité et l'échantillonnage des valeurs. Genie filtre intelligemment des exemples de requêtes SQL, de métadonnées de table et de colonne, ainsi que l’historique des conversations pour sélectionner le contexte le plus pertinent pour répondre à la requête.
Genie génère des réponses à l’aide de composants tels que les suivants :
- Métadonnées de la table catalogue Unity : inclut les noms de tables, les descriptions et les relations de clé primaire définie (PK) et de clé étrangère (FK). Genie utilise ces données pour analyser la requête et convertir l’invite de langage naturel en SQL.
- Noms de colonnes et descriptions : Genie filtre intelligemment les noms de colonnes et les descriptions pertinentes à inclure.
- Contexte de la base de connaissances : les auteurs peuvent modifier localement les métadonnées des ressources et choisir des colonnes qui fournissent des valeurs pertinentes à Genie. Cela permet à Genie de générer des réponses plus précises et ne modifie pas les métadonnées existantes du catalogue Unity. Consultez Créer une base de connaissances pour obtenir des espaces Génie plus fiables.
- Exemples de requêtes SQL : Genie sélectionne intelligemment des exemples SQL pertinents à partir de requêtes SQL.
- fonctions SQL: toutes les fonctions SQL qui ont été ajoutées dans l’espace.
- Instructions: les notes en texte brut fournies en tant que instructions générales sont incluses en tant que contexte.
- Historique des requêtes et des réponses: Les requêtes et les réponses de la conversation actuelle sont incluses en tant que contexte. Si nécessaire, en raison des limites des jetons , les parties les plus anciennes de l’enregistrement de conversation sont exclues.
Remarque
Certains détails de table, tels que le propriétaire et la taille de la table, ne sont pas inclus par défaut. Pour accéder à ces informations, utilisez des vues à partir du schéma d’informations disponible pour tous les catalogues catalogue Unity. Les vues par défaut peuvent inclure des détails inutiles. Par conséquent, la création d’une vue personnalisée peut vous aider à vous concentrer sur les informations spécifiques dont vous avez besoin. Pour plus d’informations sur les éléments disponibles dans le schéma d’informations, consultez Schéma d’informations.
Dans de nombreux cas, Genie génère une requête SQL qui s’exécute sur l’entrepôt SQL de l’espace. Les requêtes générées sont toujours en lecture seule. Les nouvelles tentatives sont gérées automatiquement, tandis que l’entrepôt de données SQL gère la simultanéité et la mise à l’échelle. Le jeu de résultats est présenté dans le cadre de la réponse.
Genie maintient des contrôles de sécurité et de confidentialité forts. Pour plus d’informations, consultez La confiance et la sécurité des fonctionnalités d’assistance d’IA Databricks.
Configurer un espace Génie
Vous pouvez créer un espace Génie si vous disposez des éléments suivants :
- Droit Databricks SQL.
- Au moins une autorisation CAN USE sur un entrepôt SQL professionnel ou serverless.
- Au moins
SELECTdes privilèges sur un ou plusieurs objets de données de l'Unity Catalog.
Voir Configurer et gérer un espace AI/BI Genie.
Espaces compagnon Genie pour les tableaux de bord IA/BI (version préliminaire publique)
Vous pouvez utiliser des invites en langage naturel pour générer des visualisations pour les tableaux de bord IA/BI avec l’Assistant Databricks. Consultez Créer des visualisations avec l’Assistant Databricks.
Lorsque vous créez un tableau de bord, Databricks crée automatiquement un espace Génie complémentaire qui permet aux utilisateurs professionnels d’effectuer des analyses de données en libre-service à l’aide du langage naturel. Consultez les espaces Génie avec des tableaux de bord.
Interagir avec un espace Génie
Les équipes professionnelles sont les utilisateurs finaux d’un espace Génie. Pour utiliser un espace Genie, les utilisateurs professionnels doivent avoir :
- L’accès consommateur ou le droit Databricks SQL.
- Au moins une autorisation CAN USE sur l’entrepôt par défaut désigné pour l’espace Genie.
- Au moins des privilèges
SELECTsur tous les objets de données Unity Catalog utilisés dans l’espace.
Les utilisateurs professionnels peuvent aider à organiser un espace en le testant et en fournissant des commentaires pendant le développement. Pour en savoir plus sur la façon dont les utilisateurs professionnels peuvent commencer à utiliser un espace Génie, consultez Utiliser un espace Génie pour explorer les données métier.
Ressources approuvées
Les actifs de confiance apportent une couche supplémentaire d’assurance quant à la précision d’un résultat pour un utilisateur spatial. Lorsque le texte exact d’une requête d’exemple paramétrable ou d’une fonction SQL est utilisé pour générer une réponse, Genie marque la réponse comme approuvée. Pour en savoir plus sur les ressources approuvées, consultez Utiliser des ressources approuvées dans les espaces AI/BI Genie . Consultez Utiliser des paramètres dans les requêtes SQL pour en savoir plus sur l’utilisation des requêtes paramétrables.
Évaluer les réponses avec des points de référence
Les points de référence vous permettent d’effectuer un scale-up des tests et de l’évaluation des réponses individuelles dans un espace Genie. Contrairement aux instructions, les points de références sont destinés à évaluer, pas à informer, votre espace Genie. Genie n’utilise pas de questions de benchmark ou d’exemple SQL pour améliorer le contexte de Genie.
À l’aide de benchmarks, vous pouvez exécuter une collection de questions de test et utiliser les réponses pour mesurer la précision de Genie. Si vous le souhaitez, vous pouvez inclure une instruction SQL qui retourne les résultats attendus. Lorsque la question de référence s’exécute, la réponse de Genie est comparée aux résultats fournis par l’instruction SQL et notée pour la précision. La question est marquée pour révision si aucune réponse SQL n’a été fournie.
Consultez Utiliser des points de référence dans un espace Genie.
Confidentialité et sécurité
L’accès aux données dans un espace Genie est régi par Unity Catalog, y compris les filtres de lignes et les masques de colonne qui ont été appliqués à vos tables. Consultez le contrôle d’accès aux données et les filtres de lignes et les masques de colonne.
Pour obtenir d’autres questions fréquentes (FAQ) sur la confidentialité et la sécurité, consultez les FAQ sur la confidentialité et la sécurité pour les fonctionnalités d’assistance à l’IA.