Freigeben über


NycTlcYellow Klasse

Represents the NYC Taxi & Limousine Commission yellow taxi trip public dataset.

Zu den gelben Taxi-Reisedaten zählen Felder, die Abhol- und Abgabedaten/-zeiten erfassen, Abhol- und Abgabeorte, Reiseabstände, Einzeltarife, Tariftypen, Zahlungstypen und Fahrerzähler zählen. Weitere Informationen zu diesem Dataset, einschließlich Spaltenbeschreibungen, unterschiedlichen Methoden für den Zugriff auf das Dataset und Beispiele finden Sie unter NYC Taxi & Limousine Commission – gelbe Taxitripdatensätze im Microsoft Azure Open Datasets-Katalog.

Initialisieren sie Filterfelder.

Konstruktor

NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parameter

Name Beschreibung
start_date

Das Datum, an dem mit dem Laden von Daten (einschließlich) begonnen werden soll. Wenn keine, wird dies default_start_date verwendet.

Standardwert: 2015-01-01 00:00:00
end_date

Das Datum, an dem das Laden von Daten (einschließlich) beendet werden soll. Wenn keine, wird dies default_end_date verwendet.

Standardwert: 2024-12-13 00:00:00
cols

Eine Liste der Spaltennamen, die aus dem Dataset geladen werden sollen. Wenn keine, werden alle Spalten geladen. Informationen zu den verfügbaren Spalten in diesem Dataset finden Sie unter NYC Taxi & Limousine Commission - yellow taxi trip records.

Standardwert: None
limit
int

Ein Wert, der die Anzahl der Tage angibt, mit to_pandas_dataframe()denen Daten geladen werden sollen. Wenn nicht angegeben, bedeutet die Standardeinstellung von -1 keine Beschränkung für geladene Tage.

Standardwert: -1
enable_telemetry

Gibt an, ob Telemetrie für dieses Dataset aktiviert werden soll.

Standardwert: True
start_date
Erforderlich

Das Startdatum, das Sie einschließlich abfragen möchten.

end_date
Erforderlich

Das Enddatum, das Sie einschließlich abfragen möchten.

cols
Erforderlich

Eine Liste der Spaltennamen, die Sie abrufen möchten. Keine ruft alle Spalten ab.

limit
Erforderlich
int

to_pandas_dataframe() lädt nur die Datenmonate "limit". -1 bedeutet keine Grenze.

enable_telemetry
Erforderlich

Gibt an, ob Telemetrie gesendet werden soll.

Hinweise

Das folgende Beispiel zeigt, wie Sie auf das Dataset zugreifen.


   from azureml.opendatasets import NycTlcYellow
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()