Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
La première étape d’une migration de données et de pipelines consiste à identifier les données que vous voulez rendre disponibles dans OneLake et les pipelines que vous avez l’intention de déplacer.
Vous disposez de deux options pour la migration des données :
- Option 1 : Azure Data Lake Storage (ADLS) Gen2 comme stockage par défaut. Si vous utilisez actuellement ADLS Gen2 et souhaitez éviter la copie des données, envisagez d’utiliser des raccourcis OneLake.
- Option 2 : OneLake comme stockage par défaut. Si vous souhaitez passer d’ADLS Gen2 à OneLake pour la couche de stockage, envisagez de lire/écrire depuis/vers OneLake à partir de vos notebooks et définitions de tâche Spark.
Migration des données
Option 1 : ADLS Gen2 comme stockage (raccourcis)
Si vous interagissez avec ADLS Gen2 et que vous souhaitez éviter la duplication des données, vous pouvez créer un raccourci vers le chemin source ADLS Gen2 dans OneLake. Vous pouvez créer des raccourcis dans les sections Fichiers et Tables du lakehouse dans Fabric avec les considérations suivantes :
- La section Fichiers est la zone non managée du lac. Si vos données sont au format CSV, JSON ou Parquet, nous vous recommandons de créer un raccourci vers cette zone.
- La section Tables est la zone managée du lac. Toutes les tables, à la fois managées par Spark et non managées, sont inscrites ici. Si vos données sont au format Delta, vous pouvez créer un raccourci dans cette zone et le processus de découverte automatique inscrit automatiquement ces tables Delta dans le metastore du lakehouse.
En savoir plus sur la création d’un raccourci ADLS Gen2.
Option 2 : OneLake comme stockage
Pour utiliser OneLake comme couche de stockage et déplacer des données d’ADLS Gen2, vous devez commencer par pointer les éléments liés à Azure Synapse Spark vers OneLake, puis transférer les données existantes vers OneLake. Pour la première, consultez Intégrer OneLake à Azure Synapse Spark.
Pour déplacer les données existantes vers OneLake, vous avez plusieurs options :
- mssparkutils fastcp : La bibliothèque mssparkutils fournit une API fastcp qui vous permet de copier les données d’ADLS Gen2 vers OneLake.
- AzCopy : Vous pouvez vous servir de l’utilitaire de ligne de commande AzCopy pour copier les données d’ADLS Gen2 vers OneLake.
- Azure Data Factory, Azure Synapse Analytics et Data Factory dans Fabric : utilisez copier l’activité pour copier les données dans le lakehouse.
- Utiliser des raccourcis : Vous pouvez activer les données historiques ADLS Gen2 dans OneLake à l’aide de raccourcis. Aucune copie de données nécessaire.
- Explorateur Stockage Azure : Vous pouvez déplacer les fichiers de l’emplacement ADLS Gen2 vers OneLake à l’aide de l’Explorateur Stockage Azure. Découvrez comment Intégrer OneLake à l’Explorateur Stockage Azure.
Migration des pipelines (activités liées à Spark)
Si vos pipelines Azure Synapse incluent des activités de définition de tâches pour notebooks et/ou pour Spark, vous devez déplacer ces pipelines d’Azure Synapse vers des pipelines de Data Factory dans Fabric et y référencer les cahiers cibles. L’activité de notebook est disponible dans les pipelines "Data Factory". Consultez toutes les activités de pipeline prises en charge dans Fabric ici.
- Pour connaître les considérations relatives à l’activité de pipeline Spark, reportez-vous aux différences entre Azure Synapse Spark et Fabric.
- Pour la migration de notebooks, reportez-vous à Migrer des notebooks d’Azure Synapse vers Fabric.
- Pour la migration de pipeline, consultez migrer vers Data Factory dans Fabric.