Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Celem większości rozwiązań typu big data jest udostępnienie szczegółowych informacji na temat danych przy użyciu analizy i raportowania. Analiza i raportowanie mogą obejmować wstępnie skonfigurowane raporty i wizualizacje lub interaktywną eksplorację danych.
Opcje technologii analizy danych
Istnieje kilka opcji analizy, wizualizacji i raportowania na platformie Azure, w zależności od potrzeb:
- Power BI
- Notesy programu Jupyter
- Notesy Zeppelin
- Notatniki Jupyter w programie Visual Studio Code (VS Code)
Power BI
Usługa Power BI to zestaw narzędzi do analizy biznesowej. Może łączyć się z setkami źródeł danych i używać ich do nieplanowanej analizy. Użyj usługi Power BI Embedded , aby zintegrować usługę Power BI we własnych aplikacjach bez konieczności posiadania dodatkowych licencji.
Organizacje mogą używać usługi Power BI do tworzenia raportów i publikowania ich w organizacji. Każdy może tworzyć spersonalizowane pulpity nawigacyjne z wbudowanym ładem i zabezpieczeniami. Usługa Power BI używa identyfikatora Entra firmy Microsoft do uwierzytelniania użytkowników logujących się do usługi Power BI. Używa poświadczeń usługi Power BI, gdy użytkownik próbuje uzyskać dostęp do zasobów wymagających uwierzytelniania.
Notatniki Jupyter
Notesy Jupyter udostępniają powłokę opartą na przeglądarce, która umożliwia naukowcom danych tworzenie plików notesów zawierających kod Python, Scala lub R oraz tekst Markdown. Dzięki tym funkcjom notesy są skutecznym sposobem współpracy dzięki udostępnianiu i dokumentowaniu kodu oraz uzyskiwaniu wyników w jednym dokumencie.
Większość odmian klastrów usługi HDInsight, takich jak Spark lub Hadoop, jest wstępnie skonfigurowanych z notesami Jupyter do interakcji z danymi i przesyłania zadań do przetwarzania. W zależności od typu używanego klastra usługi HDInsight co najmniej jedno jądro jest udostępniane do interpretowania i uruchamiania kodu. Na przykład klastry Spark w usłudze HDInsight udostępniają jądra związane z platformą Spark, które można wybrać, aby uruchomić język Python lub kod Scala przy użyciu aparatu Spark.
Notesy Jupyter zapewniają efektywne środowisko do analizowania, wizualizowania i przetwarzania danych przed utworzeniem bardziej zaawansowanych wizualizacji przy użyciu narzędzia do raportowania analizy biznesowej, takiego jak usługa Power BI.
Notesy Zeppelin
Notesy Zeppelin udostępniają również konsolę w przeglądarce, która ma podobną funkcjonalność do notesów Jupyter. Niektóre klastry usługi HDInsight są wstępnie skonfigurowane za pomocą notesów Zeppelin. Jeśli jednak używasz klastra interaktywnego zapytania usługi HDInsight (nazywanego również Apache Hive LLAP), Zeppelin jest jedynym notatnikiem, którego można użyć do uruchamiania interakcyjnych zapytań Hive. Ponadto jeśli używasz klastra usługi HDInsight przyłączonego do domeny, notesy Zeppelin są jedynym typem notesów, które umożliwiają przypisywanie różnych identyfikatorów logowania użytkowników w celu kontrolowania dostępu do notesów i bazowych tabel programu Hive.
Notatniki Jupyter w programie VS Code
VS Code to bezpłatna platforma edytora kodu i programowania, której można używać lokalnie lub połączonych ze zdalnymi obliczeniami. W przypadku korzystania z programu VS Code z rozszerzeniem Jupyter udostępnia w pełni zintegrowane środowisko do programowania jupyter, które można ulepszyć za pomocą większej liczby rozszerzeń językowych. Wybierz tę opcję, jeśli chcesz korzystać z najlepszego w swojej klasie, bezpłatnego środowiska Jupyter i mieć możliwość korzystania z wybranego środowiska obliczeniowego.
Za pomocą programu VS Code można opracowywać i uruchamiać notatniki w zdalnych lokalizacjach i kontenerach. Aby uprościć przejście z usługi Azure Notebooks, obraz kontenera jest również dostępny do użycia z programem VS Code.
Jupyter (dawniej IPython Notebook) to projekt typu open source, który umożliwia łatwe łączenie tekstu markdown i wykonywalnego kodu źródłowego języka Python na jednej kanwie nazywanej notesem. Program VS Code obsługuje natywną pracę z notesami Jupyter i plikami kodu języka Python.
Kluczowe kryteria wyboru
Zacznij zawężać wybrane opcje, odpowiadając na następujące pytania:
Czy musisz nawiązać połączenie z wieloma źródłami danych i zapewnić scentralizowane miejsce do tworzenia raportów dla danych rozmieszczonych w całej domenie? Jeśli tak, wybierz opcję, która umożliwia łączenie się z setkami źródeł danych.
Czy chcesz osadzić dynamiczne wizualizacje w zewnętrznej witrynie internetowej lub aplikacji? W takim przypadku wybierz opcję, która zapewnia możliwości osadzania.
Czy chcesz zaprojektować wizualizacje i raporty w trybie offline? Jeśli to zrobisz, wybierz opcję, która ma możliwości trybu offline.
Czy potrzebujesz dużej mocy obliczeniowej, aby wytrenować duże lub złożone modele sztucznej inteligencji lub pracować z dużymi zestawami danych? W takim przypadku wybierz opcję, która może łączyć się z klastrem danych big data.
Macierz możliwości
W poniższej tabeli przedstawiono podsumowanie kluczowych różnic w możliwościach.
Ogólne możliwości
| Zdolność | Power BI | Notatniki Jupyter | Notesy Zeppelin | Notatniki Jupyter w programie VS Code |
|---|---|---|---|---|
| Połącz się z klastrami big data w celu zaawansowanego przetwarzania. | Tak | Tak | Tak | Nie. |
| Usługa zarządzana | Tak | Tak 1 | Tak 1 | Tak |
| Nawiązywanie połączenia z setkami źródeł danych | Tak | Nie. | Nie. | Nie. |
| Możliwości w trybie offline | Tak 2 | Nie. | Nie. | Nie. |
| Funkcje osadzania | Tak | Nie. | Nie. | Nie. |
| Automatyczne odświeżanie danych | Tak | Nie. | Nie. | Nie. |
| Dostęp do wielu pakietów open source | Nie. | Tak 3 | Tak 3 | Tak 4 |
| Opcje przekształcania lub czyszczenia danych | Power Query, R | 40 języków, w tym Python, R, Julia i Scala | Ponad 20 interpreterów, w tym Python, JDBC i R | Python, F#, R |
| Cennik | Bezpłatnie dla programu Power BI Desktop (tworzenie raportów). Zobacz Cennik usługi Power BI , aby uzyskać opcje hostingu. | Bezpłatna | Bezpłatna | Bezpłatna |
| Współpraca z wieloma użytkownikami | Tak | Tak (za pośrednictwem udostępniania lub z serwerem z wieloma użytkownikami, takimi jak JupyterHub) | Tak | Tak (za pośrednictwem udostępniania) |
[1] W przypadku użycia w ramach zarządzanego klastra usługi HDInsight.
[2] Korzystanie z programu Power BI Desktop.
[3] Możesz przeszukać repozytorium Maven w celu znalezienia pakietów stworzonych przez społeczność.
Pakiety języka Python można zainstalować przy użyciu zarówno pip, jak i Conda. Pakiety języka R można zainstalować z poziomu usługi CRAN lub GitHub. Pakiety można instalować w języku F# za pośrednictwem nuget.org przy użyciu menedżera zależności Paket.
Współautorzy
Firma Microsoft utrzymuje ten artykuł. Następujący współautorzy napisali ten artykuł.
Główny autor:
- Zoiner Tejada | Dyrektor generalny i architekt
Aby wyświetlić niepubliczne profile serwisu LinkedIn, zaloguj się do serwisu LinkedIn.
Następne kroki
- Wprowadzenie do notatników Databricks
- Uruchamianie notesów usługi Azure Databricks za pomocą usługi Azure Data Factory
- Uruchom notatniki Jupyter w obszarze roboczym
- Co to jest usługa Power BI?