NycTlcYellow Klasse
Represents the NYC Taxi & Limousine Commission yellow taxi trip public dataset.
Zu den gelben Taxi-Reisedaten zählen Felder, die Abhol- und Abgabedaten/-zeiten erfassen, Abhol- und Abgabeorte, Reiseabstände, Einzeltarife, Tariftypen, Zahlungstypen und Fahrerzähler zählen. Weitere Informationen zu diesem Dataset, einschließlich Spaltenbeschreibungen, unterschiedlichen Methoden für den Zugriff auf das Dataset und Beispiele finden Sie unter NYC Taxi & Limousine Commission – gelbe Taxitripdatensätze im Microsoft Azure Open Datasets-Katalog.
Initialisieren sie Filterfelder.
Konstruktor
NycTlcYellow(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)
Parameter
| Name | Beschreibung |
|---|---|
|
start_date
|
Das Datum, an dem mit dem Laden von Daten (einschließlich) begonnen werden soll. Wenn keine, wird dies Standardwert: 2015-01-01 00:00:00
|
|
end_date
|
Das Datum, an dem das Laden von Daten (einschließlich) beendet werden soll. Wenn keine, wird dies Standardwert: 2024-12-13 00:00:00
|
|
cols
|
Eine Liste der Spaltennamen, die aus dem Dataset geladen werden sollen. Wenn keine, werden alle Spalten geladen. Informationen zu den verfügbaren Spalten in diesem Dataset finden Sie unter NYC Taxi & Limousine Commission - yellow taxi trip records. Standardwert: None
|
|
limit
|
Ein Wert, der die Anzahl der Tage angibt, mit Standardwert: -1
|
|
enable_telemetry
|
Gibt an, ob Telemetrie für dieses Dataset aktiviert werden soll. Standardwert: True
|
|
start_date
Erforderlich
|
Das Startdatum, das Sie einschließlich abfragen möchten. |
|
end_date
Erforderlich
|
Das Enddatum, das Sie einschließlich abfragen möchten. |
|
cols
Erforderlich
|
Eine Liste der Spaltennamen, die Sie abrufen möchten. Keine ruft alle Spalten ab. |
|
limit
Erforderlich
|
to_pandas_dataframe() lädt nur die Datenmonate "limit". -1 bedeutet keine Grenze. |
|
enable_telemetry
Erforderlich
|
Gibt an, ob Telemetrie gesendet werden soll. |
Hinweise
Das folgende Beispiel zeigt, wie Sie auf das Dataset zugreifen.
from azureml.opendatasets import NycTlcYellow
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()