Partager via


dataset Module

Gère l’interaction avec les jeux de données Azure Machine Learning.

Ce module fournit des fonctionnalités permettant de consommer des données brutes, de gérer les données et d’effectuer des actions sur les données dans Azure Machine Learning. Utilisez la Dataset classe de ce module pour créer des jeux de données avec les fonctionnalités du data package, qui contient les classes FileDataset de prise en charge et TabularDataset.

Pour commencer à utiliser des jeux de données, consultez l’article Ajouter et inscrire des jeux de données.

Classes

Dataset

Représente une ressource permettant d’explorer, de transformer et de gérer des données dans Azure Machine Learning.

Un jeu de données est une référence aux données dans des Datastore URL web publiques ou derrière.

Pour les méthodes déconseillées dans cette classe, vérifiez AbstractDataset la classe pour connaître les API améliorées.

Les types de jeux de données suivants sont pris en charge :

  • TabularDataset représente les données dans un format tabulaire créé en analysant le fichier ou la liste de fichiers fournis.

  • FileDataset référence des fichiers uniques ou multiples dans des magasins de données ou à partir d’URL publiques.

Pour bien démarrer avec les jeux de données, consultez l’article Ajouter et inscrire des jeux de données, ou consultez les notebooks https://aka.ms/tabulardataset-samplenotebook et https://aka.ms/filedataset-samplenotebook.

Initialisez l’objet Dataset.

Pour obtenir un jeu de données qui a déjà été inscrit auprès de l’espace de travail, utilisez la méthode get.