이 브라우저는 더 이상 지원되지 않습니다.
최신 기능, 보안 업데이트, 기술 지원을 이용하려면 Microsoft Edge로 업그레이드하세요.
특정 프롬프트 집합에 응답 품질에 대한 자체 판단을 적용하는 데 사용할 수 있는 평가 기술은 무엇입니까?
모델 벤치마크
수동 평가
자동화된 평가
생성된 응답과 표준 메트릭을 기반으로 하는 지상 진리를 비교하는 평가자는 무엇인가요?
일관성
F1 점수
보호 재질
AI 모델을 사용하여 응답에서 아이디어의 구조 및 논리적 흐름을 판단하는 평가자 메트릭은 무엇인가요?
보호된 재질
작업을 확인하기 전에 모든 질문에 대답해야 합니다.
이 페이지가 도움이 되었나요?
이 항목에 대한 도움이 필요하세요?
Ask Learn을 사용하여 이 주제를 명확히 설명하거나 안내하고 싶으신가요?