Freigeben über


NycTlcGreen Klasse

Represents the NYC Taxi & Limousine Commission green taxi trip public dataset.

Zu den grünen Taxi-Reisedaten zählen Felder, die Abhol- und Abgabedaten/-zeiten erfassen, Abhol- und Abgabeorte, Reiseabstände, Einzeltarife, Tariftypen, Zahlungstypen und Fahrerzähler zählen. Weitere Informationen zu diesem Dataset, einschließlich Spaltenbeschreibungen, unterschiedlichen Methoden für den Zugriff auf das Dataset und Beispiele finden Sie unter NYC Taxi & Limousine Commission – grüne Taxi-Reisedatensätze im Microsoft Azure Open Datasets-Katalog.

Ein Beispiel für die Verwendung der NycTlcGreen-Klasse finden Sie im Lernprogramm Verwenden des automatisierten maschinellen Lernens, um Taxitarife vorherzusagen.

Initialisieren sie Filterfelder.

Konstruktor

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parameter

Name Beschreibung
start_date

Das Datum, an dem mit dem Laden von Daten (einschließlich) begonnen werden soll. Wenn keine, wird dies default_start_date verwendet.

Standardwert: 2015-01-01 00:00:00
end_date

Das Datum, an dem das Laden von Daten (einschließlich) beendet werden soll. Wenn keine, wird dies default_end_date verwendet.

Standardwert: 2024-12-13 00:00:00
cols

Eine Liste der Spaltennamen, die aus dem Dataset geladen werden sollen. Wenn keine, werden alle Spalten geladen. Informationen zu den verfügbaren Spalten in diesem Dataset finden Sie unter NYC Taxi & Limousine Commission - green taxi trip records.

Standardwert: None
limit
int

Ein Wert, der die Anzahl der Tage angibt, mit to_pandas_dataframe()denen Daten geladen werden sollen. Wenn nicht angegeben, bedeutet die Standardeinstellung von -1 keine Beschränkung für geladene Tage.

Standardwert: -1
enable_telemetry

Gibt an, ob Telemetrie für dieses Dataset aktiviert werden soll.

Standardwert: True
start_date
Erforderlich

Das Startdatum, das Sie einschließlich abfragen möchten.

end_date
Erforderlich

Das Enddatum, das Sie einschließlich abfragen möchten.

cols
Erforderlich

Eine Liste der Spaltennamen, die Sie abrufen möchten. Keine ruft alle Spalten ab.

limit
Erforderlich
int

to_pandas_dataframe() lädt nur die Datenmonate "limit". -1 bedeutet keine Grenze.

enable_telemetry
Erforderlich

Gibt an, ob Telemetrie gesendet werden soll.

Hinweise

Das folgende Beispiel zeigt, wie Sie auf das Dataset zugreifen.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()