Freigeben über


NycTlcFhv Klasse

Represents the NYC Taxi & Limousine Commission public dataset.

Dieses Dataset enthält For-Hire Vechicle (FHV)-Reisedatensätze, darunter Felder, die die Basislizenznummer des Versands erfassen, sowie das Abholdatum, die Uhrzeit und die Taxizonen-Standort-ID (Shape-Datei unten). Diese Datensätze werden aus den FHV Trip Record-Einreichungen von Basen generiert. Weitere Informationen zu diesem Dataset, einschließlich Spaltenbeschreibungen, unterschiedlichen Methoden für den Zugriff auf das Dataset und Beispiele finden Sie unter NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV)-Reisedatensätze im Microsoft Azure Open Datasets-Katalog.

Initialisieren sie Filterfelder.

Konstruktor

NycTlcFhv(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Parameter

Name Beschreibung
start_date

Das Datum, an dem mit dem Laden von Daten (einschließlich) begonnen werden soll. Wenn keine, wird dies default_start_date verwendet.

Standardwert: 2015-01-01 00:00:00
end_date

Das Datum, an dem das Laden von Daten (einschließlich) beendet werden soll. Wenn keine, wird dies default_end_date verwendet.

Standardwert: 2024-12-13 00:00:00
cols

Eine Liste der Spaltennamen, die aus dem Dataset geladen werden sollen. Wenn keine, werden alle Spalten geladen. Informationen zu den verfügbaren Spalten in diesem Dataset finden Sie unter NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) Reisedatensätze.

Standardwert: None
limit
int

Ein Wert, der die Anzahl der Tage angibt, mit to_pandas_dataframe()denen Daten geladen werden sollen. Wenn nicht angegeben, bedeutet die Standardeinstellung von -1 keine Beschränkung für geladene Tage.

Standardwert: -1
enable_telemetry

Gibt an, ob Telemetrie für dieses Dataset aktiviert werden soll.

Standardwert: True
start_date
Erforderlich

Das Startdatum, das Sie einschließlich abfragen möchten.

end_date
Erforderlich

Das Enddatum, das Sie einschließlich abfragen möchten.

cols
Erforderlich

Eine Liste der Spaltennamen, die Sie abrufen möchten. Keine ruft alle Spalten ab.

limit
Erforderlich
int

to_pandas_dataframe() lädt nur die Datenmonate "limit". -1 bedeutet keine Grenze.

enable_telemetry
Erforderlich

Gibt an, ob Telemetrie gesendet werden soll.

Hinweise

Das folgende Beispiel zeigt, wie Sie auf das Dataset zugreifen.


   from azureml.opendatasets import NycTlcFhv
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()