Compartilhar via


DataReference Classe

Representa uma referência aos dados em um armazenamento de dados.

Um DataReference representa um caminho em um armazenamento de dados e pode ser usado para descrever como e onde os dados devem ser disponibilizados em uma execução. Não é mais a abordagem recomendada para acesso e entrega de dados no Azure Machine Learning. O conjunto de dados dá suporte ao acesso a dados do Armazenamento de Blobs do Azure, dos Arquivos do Azure, do Azure Data Lake Storage Gen1, do Azure Data Lake Storage Gen2, do Banco de Dados SQL do Azure e do Banco de Dados do Azure para PostgreSQL por meio de uma interface unificada com recursos de gerenciamento de dados adicionados. É recomendável usar o conjunto de dados para ler dados em seus projetos de machine learning.

Para obter mais informações sobre como usar o conjunto de dados do Azure ML em dois cenários comuns, consulte os artigos:

Construtor DataReference de classe.

Construtor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parâmetros

Nome Description
datastore
Obrigatório

O armazenamento de dados para referenciar.

data_reference_name
str

O nome da referência de dados.

Valor padrão: None
path_on_datastore
str

O caminho relativo no armazenamento de suporte para referência de dados.

Valor padrão: None
mode
str

A operação na referência de dados. Os valores com suporte são 'mount' (o padrão) e 'download'.

Use o modo 'download' quando o script espera um caminho específico (por exemplo, codificado em código) para os dados de entrada. Nesse caso, especifique o caminho com o path_on_compute parâmetro ao declarar a DataReference. O Azure Machine Learning baixará os dados especificados por esse caminho antes de executar seu script.

Com o modo 'mount', um diretório temporário é criado com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definida com o caminho para o diretório temporário. Se você passar um DataReference para a lista de argumentos para uma etapa de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local em runtime.

Valor padrão: mount
path_on_compute
str

O caminho no destino de computação para a referência de dados.

Valor padrão: None
overwrite

Indica se os dados existentes devem ser substituídos.

Valor padrão: False
datastore
Obrigatório

O armazenamento de dados para referenciar.

data_reference_name
Obrigatório
str

O nome da referência de dados.

path_on_datastore
Obrigatório
str

O caminho relativo no armazenamento de suporte para referência de dados.

mode
Obrigatório
str

A operação na referência de dados. Valores com suporte 'mount' (o padrão) e 'download'.

Use o modo 'download' quando o script espera um caminho específico (por exemplo, codificado em código) para os dados de entrada. Nesse caso, especifique o caminho com o path_on_compute parâmetro ao declarar a DataReference. O Azure Machine Learning baixará os dados especificados por esse caminho antes de executar seu script.

Com o modo 'mount', um diretório temporário é criado com os dados montados e uma variável de ambiente $AZUREML_DATAREFERENCE_<data_reference_name> é definida com o caminho para o diretório temporário. Se você passar um DataReference para a lista de argumentos para uma etapa de pipeline (por exemplo, PythonScriptStep), a referência será expandida para o caminho de dados local em runtime.

path_on_compute
Obrigatório
str

O caminho no destino de computação para a referência de dados.

overwrite
Obrigatório

Indica se os dados existentes devem ser substituídos.

Comentários

Um DataReference define o local dos dados e como os dados são usados na associação de computação de destino (montagem ou upload). O caminho para os dados no armazenamento de dados pode ser a raiz /, um diretório dentro do armazenamento de dados ou um arquivo no armazenamento de dados.

Métodos

as_download

Alterne a operação de referência de dados para baixar.

O download do DataReference dá suporte apenas ao Blob do Azure e ao Compartilhamento de Arquivos do Azure. Para baixar dados do Blob do Azure, do Compartilhamento de Arquivos do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos usar o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Alterne a operação de referência de dados para montar.

A montagem dataReference só dá suporte ao Blob do Azure. Para montar dados no Blob do Azure, no Compartilhamento de Arquivos do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos usar o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Alterne a operação de referência de dados para carregar.

Para obter mais informações sobre quais computações e armazenamentos de dados dão suporte ao carregamento dos dados, consulte: https://aka.ms/datastore-matrix.

create

Crie um DataReference usando DataPath e DataPathComputeBinding.

path

Crie uma instância dataReference com base no caminho fornecido.

to_config

Converta o objeto DataReference em objeto DataReferenceConfiguration.

as_download

Alterne a operação de referência de dados para baixar.

O download do DataReference dá suporte apenas ao Blob do Azure e ao Compartilhamento de Arquivos do Azure. Para baixar dados do Blob do Azure, do Compartilhamento de Arquivos do Azure, do Azure Data Lake Gen1 e do Azure Data Lake Gen2, recomendamos usar o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parâmetros

Nome Description
path_on_compute
str

O caminho na computação para a referência de dados.

Valor padrão: None
overwrite

Indica se os dados existentes devem ser substituídos.

Valor padrão: False

Retornos

Tipo Description

Um novo objeto de referência de dados.

as_mount

Alterne a operação de referência de dados para montar.

A montagem dataReference só dá suporte ao Blob do Azure. Para montar dados no Blob do Azure, no Compartilhamento de Arquivos do Azure, no Azure Data Lake Gen1 e no Azure Data Lake Gen2, recomendamos usar o Conjunto de Dados do Azure Machine Learning. Para obter mais informações sobre como criar e usar o conjunto de dados, visite https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Retornos

Tipo Description

Um novo objeto de referência de dados.

as_upload

Alterne a operação de referência de dados para carregar.

Para obter mais informações sobre quais computações e armazenamentos de dados dão suporte ao carregamento dos dados, consulte: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parâmetros

Nome Description
path_on_compute
str

O caminho na computação para a referência de dados.

Valor padrão: None
overwrite

Indica se os dados existentes devem ser substituídos.

Valor padrão: False

Retornos

Tipo Description

Um novo objeto de referência de dados.

create

Crie um DataReference usando DataPath e DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parâmetros

Nome Description
data_reference_name
str

O nome da referência de dados a ser criada.

Valor padrão: None
datapath

[Obrigatório] O datapath a ser usado.

Valor padrão: None
datapath_compute_binding

[Obrigatório] A associação de computação de datapath a ser usada.

Valor padrão: None

Retornos

Tipo Description

Um objeto DataReference.

path

Crie uma instância dataReference com base no caminho fornecido.

path(path=None, data_reference_name=None)

Parâmetros

Nome Description
path
str

O caminho no armazenamento de dados.

Valor padrão: None
data_reference_name
str

O nome da referência de dados.

Valor padrão: None

Retornos

Tipo Description

O objeto de referência de dados.

to_config

Converta o objeto DataReference em objeto DataReferenceConfiguration.

to_config()

Retornos

Tipo Description

Um novo objeto DataReferenceConfiguration.