Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Funkcja ai.classify używa generowania sztucznej inteligencji do kategoryzowania tekstu wejściowego zgodnie z wybranymi etykietami niestandardowymi z jednym wierszem kodu.
Uwaga / Notatka
- W tym artykule omówiono używanie ai.classify z PySpark. Aby użyć ai.classify z pandas, zobacz ten artykuł.
- Zobacz inne funkcje sztucznej inteligencji w tym artykule przeglądu.
- Dowiedz się, jak dostosować konfigurację funkcji sztucznej inteligencji.
Przegląd
Funkcja ai.classify jest dostępna dla ramek danych platformy Spark. Musisz określić nazwę istniejącej kolumny wejściowej jako parametr wraz z listą etykiet klasyfikacji.
Funkcja zwraca nową ramkę danych z etykietami, które pasują do każdego wiersza tekstu wejściowego przechowywanego w kolumnie wyjściowej.
Składnia
df.ai.classify(labels=["category1", "category2", "category3"], input_col="text", output_col="classification")
Parametry
| Name | Description |
|---|---|
labels Required |
Tablicaciągów reprezentujących zestaw etykiet klasyfikacji, które mają być zgodne z wartościami tekstowymi w kolumnie wejściowej. |
input_col Required |
Ciąg zawierający nazwę istniejącej kolumny z wartościami tekstowymi wejściowymi, które mają być klasyfikowane zgodnie z etykietami niestandardowymi. |
output_col Opcjonalnie |
Ciąg zawierający nazwę nowej kolumny, w której chcesz przechowywać etykietę klasyfikacji dla każdego wejściowego wiersza tekstu. Jeśli nie ustawisz tego parametru, dla kolumny wyjściowej zostanie wygenerowana domyślna nazwa. |
error_col Opcjonalnie |
Ciąg zawierający nazwę nowej kolumny. Nowa kolumna przechowuje wszelkie błędy interfejsu OpenAI, które wynikają z przetwarzania każdego wiersza tekstu wejściowego. Jeśli nie ustawisz tego parametru, zostanie wygenerowana domyślna nazwa kolumny błędu. Jeśli nie ma błędów dla wiersza danych wejściowych, wartość w tej kolumnie jest null. |
Zwraca
Funkcja zwraca ramkę danych platformy Spark zawierającą nową kolumnę zawierającą etykiety klasyfikacji pasujące do każdego wejściowego wiersza tekstu. Jeśli nie można sklasyfikować wartości tekstowej, odpowiednia etykieta jest null.
Example
# This code uses AI. Always review output for mistakes.
df = spark.createDataFrame([
("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
], ["descriptions"])
categories = df.ai.classify(labels=["kitchen", "bedroom", "garage", "other"], input_col="descriptions", output_col="categories")
display(categories)
Ta przykładowa komórka kodu udostępnia następujące dane wyjściowe:
Treści powiązane
Wykrywanie emocji z ai.analyze_sentiment.
Generowanie osadzania wektorów za pomocą pliku ai.embed.
Wyodrębnij jednostki przy użyciu ai_extract.
Popraw gramatykę za pomocą ai.fix_grammar.
Odpowiedz na niestandardowe monity użytkownika za pomocą ai.generate_response.
Oblicz podobieństwo za pomocą funkcji ai.similarity.
Podsumuj tekst za pomocą pliku ai.summarize.
Tłumaczenie tekstu za pomocą pliku ai.translate.
Dowiedz się więcej o pełnym zestawie funkcji sztucznej inteligencji.
Dostosowywanie konfiguracji funkcji sztucznej inteligencji.
Czy brakowało nam potrzebnej funkcji? Zaproponuj to na forum Fabric Ideas.