Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Przykładowe notesy Jupyter dla zestawów danych Usługi Azure Open wyjaśniają, jak ładować otwarte zestawy danych i używać ich do wzbogacania danych demonstracyjnych. Techniki obejmują używanie platform Apache Spark i Pandas do przetwarzania danych.
Ważne
Podczas pracy w środowisku nienależący do platformy Spark funkcja Open Datasets umożliwia pobieranie tylko jednego miesiąca danych w danym czasie z określonymi klasami, aby uniknąć problemów z funkcją MemoryError w przypadku dużych zestawów danych.
Ładowanie danych zintegrowanej bazy danych surface (ISD) NOAA
| Notes | opis |
|---|---|
| Ładowanie danych o pogodzie w ostatnim miesiącu do ramki danych Biblioteki Pandas | Dowiedz się, jak załadować historyczne dane pogodowe do ulubionej ramki danych biblioteki Pandas. |
| Ładowanie danych o pogodzie w ostatnim miesiącu do ramki danych platformy Spark | Dowiedz się, jak załadować historyczne dane pogodowe do ulubionej ramki danych platformy Spark. |
Dołączanie danych demonstracyjnych przy użyciu danych ISD NOAA
| Notes | opis |
|---|---|
| Dołączanie danych demonstracyjnych przy użyciu danych pogodowych — Pandas | Dołącz do miesięcznego demonstracyjnego zestawu danych lokalizacji czujników z odczytami pogody w ramce danych biblioteki Pandas. |
| Dołączanie danych demonstracyjnych przy użyciu danych pogodowych — Spark | Dołącz do pokazowego zestawu danych lokalizacji czujników z odczytami pogody w ramce danych platformy Spark. |
Dołączanie danych taksówek w NOWYM Jorku przy użyciu danych ISD NOAA
| Notes | opis |
|---|---|
| Dane podróży taksówką wzbogacone o dane pogodowe — Pandas | Załaduj dane zielonych taksówek NYC (ponad miesiąc) i wzbogacij je danymi o pogodzie w ramce danych biblioteki Pandas. W tym przykładzie metoda zastępuje metodę get_pandas_limit i równoważy wydajność ładowania danych przy użyciu ilości danych. |
| Dane dotyczące przejazdów taksówką wzbogacone danymi o pogodzie — Spark | Załaduj dane zielonych taksówek w Nowym Jorku i wzbogać je o dane pogodowe w ramce danych platformy Spark. |