Używanie biblioteki ai.classify z rozwiązaniem PySpark

Funkcja ai.classify używa generowania sztucznej inteligencji do kategoryzowania tekstu wejściowego zgodnie z wybranymi etykietami niestandardowymi z jednym wierszem kodu.

Uwaga / Notatka

W tym artykule omówiono używanie ai.classify z PySpark. Aby użyć ai.classify z pandas, zobacz ten artykuł.
Zobacz inne funkcje sztucznej inteligencji w tym artykule przeglądu.
Dowiedz się, jak dostosować konfigurację funkcji sztucznej inteligencji.

Przegląd

Funkcja ai.classify jest dostępna dla ramek danych platformy Spark. Musisz określić nazwę istniejącej kolumny wejściowej jako parametr wraz z listą etykiet klasyfikacji.

Funkcja zwraca nową ramkę danych z etykietami, które pasują do każdego wiersza tekstu wejściowego przechowywanego w kolumnie wyjściowej.

Składnia

df.ai.classify(labels=["category1", "category2", "category3"], input_col="text", output_col="classification")

Parametry

Name	Description
`labels` Required	Tablica ciągów reprezentujących zestaw etykiet klasyfikacji, które mają być zgodne z wartościami tekstowymi w kolumnie wejściowej.
`input_col` Required	Ciąg zawierający nazwę istniejącej kolumny z wartościami tekstowymi wejściowymi, które mają być klasyfikowane zgodnie z etykietami niestandardowymi.
`output_col` Opcjonalnie	Ciąg zawierający nazwę nowej kolumny, w której chcesz przechowywać etykietę klasyfikacji dla każdego wejściowego wiersza tekstu. Jeśli nie ustawisz tego parametru, dla kolumny wyjściowej zostanie wygenerowana domyślna nazwa.
`error_col` Opcjonalnie	Ciąg zawierający nazwę nowej kolumny. Nowa kolumna przechowuje wszelkie błędy interfejsu OpenAI, które wynikają z przetwarzania każdego wiersza tekstu wejściowego. Jeśli nie ustawisz tego parametru, zostanie wygenerowana domyślna nazwa kolumny błędu. Jeśli nie ma błędów dla wiersza danych wejściowych, wartość w tej kolumnie jest `null`.

Zwraca

Funkcja zwraca ramkę danych platformy Spark zawierającą nową kolumnę zawierającą etykiety klasyfikacji pasujące do każdego wejściowego wiersza tekstu. Jeśli nie można sklasyfikować wartości tekstowej, odpowiednia etykieta jest null.

Example

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
    ], ["descriptions"])
    
categories = df.ai.classify(labels=["kitchen", "bedroom", "garage", "other"], input_col="descriptions", output_col="categories")
display(categories)

Ta przykładowa komórka kodu udostępnia następujące dane wyjściowe:

Użyj biblioteki ai.classify z biblioteką pandas.
Wykrywanie emocji z ai.analyze_sentiment.
Generowanie osadzania wektorów za pomocą pliku ai.embed.
Wyodrębnij jednostki przy użyciu ai_extract.
Popraw gramatykę za pomocą ai.fix_grammar.
Odpowiedz na niestandardowe monity użytkownika za pomocą ai.generate_response.
Oblicz podobieństwo za pomocą funkcji ai.similarity.
Podsumuj tekst za pomocą pliku ai.summarize.
Tłumaczenie tekstu za pomocą pliku ai.translate.
Dowiedz się więcej o pełnym zestawie funkcji sztucznej inteligencji.
Dostosowywanie konfiguracji funkcji sztucznej inteligencji.
Czy brakowało nam potrzebnej funkcji? Zaproponuj to na forum Fabric Ideas.

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-11-13