Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
W tym artykule opisano moduły w programie Machine Learning Studio (wersja klasyczna), których można używać do podstawowego manipulowania danymi.
Uwaga
Dotyczy: Machine Learning Studio (wersja klasyczna)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Machine Learning Studio (klasyczne) obsługuje zadania specyficzne dla uczenia maszynowego, takie jak normalizacja lub wybór funkcji. Moduły w tej kategorii są przeznaczone do bardziej ogólnych zadań.
Zadania manipulowania danymi
Moduły w tej kategorii są przeznaczone do obsługi podstawowych zadań zarządzania danymi, które mogą być wykonywane w programie Machine Learning Studio (wersja klasyczna). Poniżej przedstawiono przykłady podstawowych zadań zarządzania danymi:
- Połącz dwa zestawy danych za pomocą sprzężenia lub scalając kolumny lub wiersze.
- Utwórz nowe kategorie do użycia podczas grupowania danych.
- Modyfikowanie nagłówków kolumn, zmienianie typów danych kolumn lub flagowanie kolumn jako cech lub etykiet.
- Sprawdź brakujące wartości, a następnie zastąp je odpowiednimi wartościami.
Zadania powiązane
- Wykonaj próbkowanie lub podziel zestaw danych na zestaw szkoleniowy i testowy: użyj modułów Przekształcanie danych — próbkowanie i dzielenie .
- Skaluj liczby, normalizuj dane lub umieszczaj wartości liczbowe w pojemnikach: użyj modułów Przekształcanie danych — skalowanie i zmniejszanie .
- Wykonywanie obliczeń na polach danych liczbowych lub generowanie często używanych statystyk: Użyj narzędzi w funkcjach statystycznych.
Przykłady
Przykłady pracy ze złożonymi danymi w eksperymentach uczenia maszynowego można znaleźć w tych przykładach w Azure AI Gallery:
- Przetwarzanie i analiza danych: Demonstruje kluczowe narzędzia i procesy.
- Wykrywanie raka choroby: Ilustruje sposób partycjonowania zestawów danych, a następnie stosowania specjalnego przetwarzania do każdej partycji.
Moduły w tej kategorii
Kategoria Przekształcanie danych — Manipulowanie obejmuje następujące moduły:
- Dodaj kolumny: dodaje zestaw kolumn z jednego zestawu danych do innego.
- Dodaj wiersze: dołącza zestaw wierszy z wejściowego zestawu danych na końcu innego zestawu danych.
- Zastosuj SQL danych: uruchamia zapytanie SQLite dla wejściowych zestawów danych w celu przekształcenia danych.
- Czyszczenie brakujących danych: określa sposób obsługi wartości, których brakuje w zestawie danych. Ten moduł zastępuje moduł Missing Values Scrubber (Czyszczenie brakujących wartości), który został wycofany.
- Konwertuj na wartości wskaźnika: konwertuje wartości kategorii w kolumnach na wartości wskaźników.
- Edytowanie metadanych: edytuje metadane skojarzone z kolumnami w zestawie danych.
- Grupuj wartości podzielone na kategorie: grupuje dane z wielu kategorii w nową kategorię.
- Połącz dane: łączy dwa zestawy danych.
- Usuń zduplikowane wiersze: usuwa zduplikowane wiersze z zestawu danych.
- Wybierz pozycję Kolumny w zestawie danych: wybiera kolumny do dołączyć do zestawu danych lub wykluczyć je z zestawu danych w operacji.
- Wybieranie przekształcenia kolumn: tworzy przekształcenie, które wybiera ten sam podzbiór kolumn, co w określonym zestawie danych.
- SMOTE: Zwiększa liczbę przykładów o niskiej częstotliwości w zestawie danych przy użyciu syntetyczną oversampling.