Partager via


Configurer la qualité des données pour les données Snowflake

Lors de l’analyse des sources de données Snowflake, Microsoft Purview prend en charge l’extraction de métadonnées techniques, notamment :

  • Serveur, bases de données, schémas et tables, y compris les colonnes ; vues, y compris les colonnes, les clés étrangères et les contraintes uniques.
  • Procédures stockées, y compris le jeu de données de paramètres et le jeu de résultats.
  • Fonctions, y compris le jeu de données de paramètres.
  • Canaux, phases et flux, y compris les colonnes.
  • Tâches et séquences.

Inscrire une source Snowflake dans Data Map

Pour inscrire une nouvelle source Snowflake dans Catalogue unifié Microsoft Purview, procédez comme suit :

  • Connectez-vous au portail Microsoft Purview.
  • Sélectionnez la solution Data Map carte. Si la solution Data Map carte n’est pas affichée, sélectionnez Afficher toutes les solutions, puis Data Map dans la section Core.
  • Sélectionner Inscription.
  • Dans Inscrire des sources, sélectionnez Snowflake.

Configurer une analyse Data Map

  • Sélectionnez la source Snowflake inscrite.
  • Sélectionnez + Nouvelle analyse.
  • Fournissez les détails suivants :
    • Nom : nom de l’analyse.
    • Se connecter via le runtime d’intégration : sélectionnez le Azure runtime d’intégration résolu automatiquement, Managed Réseau virtuel IR ou SHIR en fonction de votre scénario.
    • Hôte pour la connexion : choisissez le point de terminaison utilisé pour établir la connexion à Snowflake pendant l’analyse. Vous pouvez choisir parmi l’URL du serveur ou les autres hôtes que vous avez configurés dans la source de données.
    • Informations d’identification : sélectionnez les informations d’identification pour vous connecter à votre source de données. Veillez à :
      • Sélectionnez Authentification de base lors de la création d’informations d’identification.
      • Indiquez le nom d’utilisateur utilisé pour se connecter à Snowflake dans le champ d’entrée Nom d’utilisateur.
      • Stockez le mot de passe utilisateur utilisé pour se connecter à Snowflake dans la clé secrète.
    • Entrepôt : spécifiez le nom de l’entrepôt instance utilisé pour permettre l’analyse dans les cas majuscules. Le rôle par défaut attribué à l’utilisateur spécifié dans les informations d’identification doit avoir des droits d’UTILISATION sur cet entrepôt.
    • Bases de données : spécifiez un ou plusieurs noms de instance de base de données à importer en majuscules. Séparez les noms de la liste par un point-virgule (;). Par exemple, DB1 ; DB2. Le rôle par défaut attribué à l’utilisateur spécifié dans les informations d’identification doit disposer de droits adéquats sur les objets de base de données.
    • Schéma : Liste des sous-ensembles de schémas à importer, exprimés sous la forme d’une liste séparée par des points-virgules.
  • Sélectionnez Tester la connexion pour valider les paramètres (disponibles lors de l’utilisation de Azure Integration Runtime).
  • Cliquez sur Continuer.
  • Sélectionnez un ensemble de règles d’analyse pour la classification. Vous pouvez choisir entre le système par défaut et les ensembles de règles personnalisés existants ou créer un nouvel ensemble de règles inline.
  • Passez en revue votre analyse et sélectionnez Enregistrer et exécuter.

Une fois analysée, la ressource de données dans Snowflake est disponible sur la recherche Catalogue unifié. Pour plus d’informations sur la connexion et la gestion de Snowflake dans Microsoft Purview, consultez Se connecter et gérer Snowflake dans Microsoft Purview.

Importante

Lorsque vous supprimez l’objet de la source de données, l’analyse suivante ne supprime pas automatiquement la ressource correspondante dans Microsoft Purview.

Configurer la connexion à la source de données Snowflake pour l’analyse de la qualité des données

À ce stade, la ressource analysée est prête pour le catalogage et la gouvernance. Associez la ressource analysée au produit de données dans un sele de domaine de gouvernance. Sous l’onglet Qualité des données, ajoutez un nouveau Azure SQL Connexion à la base de données : obtenir le nom de la base de données entré manuellement.

  1. Dans le portail Microsoft Purview, ouvrez Catalogue unifié.

  2. Sous Gestion de l’intégrité, sélectionnez Qualité des données.

  3. Sélectionnez un domaine de gouvernance dans la liste, puis sélectionnez Connexions dans la liste déroulante Gérer .

  4. Configurez la connexion dans la page Connexions :

    • Ajoutez le nom et la description de la connexion.
    • Sélectionnez le type de source Snowflake.
    • Ajoutez le nom du serveur, le nom de l’entrepôt, le nom de la base de données, le nom du schéma et le nom de la table.
    • Sélectionnez Méthode d’authentification - Authentification de base.
    • Ajoutez un nom d’utilisateur.
    • Ajouter des informations d’identification :
      • Ajouter un abonnement Azure
      • Connexion au coffre de clés
      • Nom du secret
      • Version du secret
    • Cochez la case Activer le réseau virtuel managési votre Snowflake s’exécute sur Azure Réseau virtuel.
    • Sélectionnez la région Azure.
    • Ajoutez l’ID de ressources Private Link.
    • Ajoutez un nom de domaine complet.
  5. Testez la connexion pour vérifier qu’elle fonctionne. Si vous utilisez Réseau virtuel, la fonctionnalité de test de connexion n’est pas prise en charge.

    Capture d’écran montrant comment configurer une connexion en flocon.

    Capture d’écran montrant comment configurer le jeton de connexion snowflake.

L’ID de ressource pour la liaison privée Snowflake cible est au format suivant : /subscriptions/(subscription_id)/resourcegroups/az(region)-privatelink/providers/microsoft.network/privatelinkservices/sf-pvlinksvc-az(region).

  • Pour obtenir l’ID de région et le nom complet, exécutez SYSTEM_WHITE_LIST et SYSTEM_WHITE_LIST_PRIVATELINK pour obtenir les SNOWFLAKE_DEPLOYMENTvaleurs , SNOWFLAKE_DEPLOYMENT_REGIONLESSet OCSP_CACHE pour les hôtes publics et de liste d’autorisation.
  • Pour obtenir l’ID d’abonnement, exécutez SYSTEM$GET_SNOWFLAKE_PLATFORM_INFO() comme ACCOUNTADMIN pour obtenir les valeurs snowflake-vnet-subnet-ids . L’ID d’abonnement pour le Private Link du locataire Azure Snowflake est obtenu à partir de ce.

Importante

  • Une fois la demande de connexion de point de terminaison privé créée, un ticket de support doit être déclenché avec la prise en charge de Snowflake pour approuver la connexion de point de terminaison privé. Fournissez les détails de l’ID de ressource de point de terminaison privé managé dans ce ticket de support pour que l’équipe Snowflake l’approuve.
  • Les gestionnaires de la qualité des données ont besoin d’un accès en lecture seule à Snowflake pour configurer la connexion de qualité des données.
  • Le connecteur Snowflake n’accepte pas https://. Supprimez https:// lorsque vous ajoutez le nom du serveur pour configurer la connexion à la source de données.
  • Si l’accès public est désactivé, vous devez sélectionner Autoriser les services Microsoft approuvés pour Key Vault. Cela est nécessaire uniquement pour Key Vault, et non pour votre espace de travail Snowflake.

Remarque

La prise en charge d’Open Authorization (OAuth) et de la paire de clés pour la connexion à la base de données Snowflake sera ajoutée. Avec les mécanismes d’authentification OAuth et basés sur les paires de clés pris en charge pour Snowflake, vous pouvez créer plusieurs connexions prenant en charge des mécanismes d’authentification différents. Dans ce cas, la logique de sélection de la dernière connexion créée se maintient. Par exemple, si vous créez d’abord une connexion basée sur une paire de clés suivie d’OAuth, celle-ci est récupérée. Si vous souhaitez que la connexion de paire de clés soit récupérée, vous devez supprimer le mécanisme OAuth. Contactez votre représentant de compte Microsoft si vous souhaitez afficher un aperçu du nouveau modèle d’authentification Snowflake pour l’analyse Qualité des données Microsoft Purview.

Profilage et analyse de la qualité des données dans Snowflake

Après avoir configuré la connexion, vous pouvez profiler vos données, créer et appliquer des règles, et exécuter une analyse de la qualité des données pour vos données dans Snowflake. Suivez les instructions pas à pas décrites dans les documents suivants :

Ressources