PySpark에서 ai.classify 사용

이 함수는 ai.classify 생성 AI를 사용하여 사용자가 선택한 사용자 지정 레이블에 따라 한 줄의 코드로 입력 텍스트를 분류합니다.

비고

이 문서에서는 PySpark에서 ai.classify 를 사용하는 방법에 대해 설명합니다. pandas와 함께 ai.classify 를 사용하려면 이 문서를 참조하세요.
이 개요 문서에서 다른 AI 함수를 참조하세요.
AI 함수의 구성을 사용자 지정하는 방법을 알아봅니다.

개요

이 ai.classify 함수는 Spark DataFrames에 사용할 수 있습니다. 분류 레이블 목록과 함께 기존 입력 열의 이름을 매개 변수로 지정해야 합니다.

이 함수는 출력 열에 저장된 입력 텍스트의 각 행과 일치하는 레이블이 있는 새 DataFrame을 반환합니다.

구문

df.ai.classify(labels=["category1", "category2", "category3"], input_col="text", output_col="classification")

매개 변수

이름	Description
`labels` 필수	입력 열의 텍스트 값과 일치시킬 분류 레이블 집합을 나타내는 문자열 배열입니다.
`input_col` 필수	사용자 지정 레이블에 따라 분류할 입력 텍스트 값이 있는 기존 열의 이름을 포함하는 문자열 입니다.
`output_col` 선택적	각 입력 텍스트 행에 대한 분류 레이블을 저장하려는 새 열의 이름을 포함하는 문자열 입니다. 이 매개 변수를 설정하지 않으면 출력 열에 대한 기본 이름이 생성됩니다.
`error_col` 선택적	새 열의 이름을 포함하는 문자열. 새 열은 입력 텍스트의 각 행을 처리하여 발생하는 OpenAI 오류를 저장합니다. 이 매개 변수를 설정하지 않으면 오류 열에 대한 기본 이름이 생성됩니다. 입력 행에 오류가 없으면 이 열의 값이 `null`.

반환

이 함수는 각 입력 텍스트 행과 일치하는 분류 레이블이 포함된 새 열을 포함하는 Spark DataFrame 을 반환합니다. 텍스트 값을 분류할 수 없는 경우 해당 레이블은 null.

예제

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
    ], ["descriptions"])
    
categories = df.ai.classify(labels=["kitchen", "bedroom", "garage", "other"], input_col="descriptions", output_col="categories")
display(categories)

이 예제 코드 셀은 다음과 같은 출력을 제공합니다.

pandas와 함께 ai.classify를 사용합니다.
ai.analyze_sentiment 사용하여 감정을 감지합니다.
ai.embed를 사용하여 벡터 포함을 생성합니다.
ai_extract 사용하여 엔터티를 추출합니다.
ai.fix_grammar 사용하여 문법을 수정합니다.
ai.generate_response 사용하여 사용자 지정 사용자 프롬프트에 응답합니다.
ai.similarity를 사용하여 유사성을 계산합니다.
ai.summarize를 사용하여 텍스트를 요약합니다.
ai.translate를 사용하여 텍스트를 번역합니다.
전체 AI 함수 집합에 대해 자세히 알아봅니다.
AI 함수의 구성을 사용자 지정합니다.
필요한 기능이 누락되었나요? 패브릭 아이디어 포럼에 의견을 남겨보세요.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2025-11-13

다음을 통해 공유

PySpark에서 ai.classify 사용

개요

구문

매개 변수

반환

예제

관련 콘텐츠

피드백

추가 리소스