Partilhar via


NycTlcYellow Classe

Representa o conjunto de dados público de viagem de táxi amarelo NYC Taxi & Limousine Commission.

Os registros amarelos de viagem de táxi incluem campos que capturam datas/horários de embarque e desembarque, locais de embarque e desembarque, distâncias da viagem, tarifas discriminadas, tipos de tarifa, tipos de pagamento e contagens de passageiros relatados pelo motorista. Para obter mais informações sobre esse conjunto de dados, incluindo descrições de colunas, diferentes maneiras de acessar o conjunto de dados e exemplos, consulte NYC Taxi & Limousine Commission - yellow taxi trip records no catálogo do Microsoft Azure Open Datasets.

Inicializar campos de filtragem.

Construtor

NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parâmetros

Name Description
start_date

A data em que deve começar a carregar dados, inclusive. Se Nenhum, o default_start_date é usado.

Default value: 2015-01-01 00:00:00
end_date

A data em que os dados devem ser terminados, inclusive. Se Nenhum, o default_end_date é usado.

Default value: 2024-12-13 00:00:00
cols

Uma lista de nomes de colunas a serem carregados do conjunto de dados. Se Nenhuma, todas as colunas serão carregadas. Para obter informações sobre as colunas disponíveis neste conjunto de dados, consulte NYC Taxi & Limousine Commission - yellow taxi trip records.

Default value: None
limit
int

Um valor que indica o número de dias de dados a serem carregados com to_pandas_dataframe()o . Se não for especificado, o padrão de -1 significa que não há limite de dias carregados.

Default value: -1
enable_telemetry

Se a telemetria deve ser habilitada nesse conjunto de dados.

Default value: True
start_date
Necessário

A data de início que você gostaria de consultar inclusive.

end_date
Necessário

A data de término que você gostaria de consultar, inclusive.

cols
Necessário

Uma lista de nomes de colunas que você gostaria de recuperar. Nenhum receberá todas as colunas.

limit
Necessário
int

to_pandas_dataframe() carregará apenas "limites" meses de dados. -1 significa sem limite.

enable_telemetry
Necessário

Indica se a telemetria deve ser enviada.

Observações

O exemplo abaixo mostra como acessar o conjunto de dados.


   from azureml.opendatasets import NycTlcYellow
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()