다음을 통해 공유


효과적인 제니 공간 만들기

Genie 공간을 큐레이팅하는 목적은 비즈니스 사용자가 자연어 질문을 제기하고 데이터에 기반하여 정확하고 일관된 답변을 얻을 수 있는 환경을 만드는 것입니다. Genie 공간은 정교한 쿼리를 생성하고 일반적인 세계 지식을 이해하는 고급 모델을 사용합니다.

대부분의 비즈니스 질문은 도메인별 질문이므로 공간 큐레이터의 역할은 일반적인 세계 지식과 특정 도메인 또는 특정 회사에서 사용되는 특수 언어 사이의 격차를 해소하는 것입니다. 큐레이터는 메타데이터와 지침을 사용하여 Genie가 비즈니스 사용자의 질문을 정확하게 해석하고 응답하는 데 도움을 줍니다. 이 문서에서는 성공적인 공간 개발을 안내하는 모범 사례 및 원칙을 간략하게 설명합니다.

새 공간을 정의하기 위한 모범 사례

지니 공간을 빌드할 때 다음 지침 원칙을 염두에 두세요.

  • 간결하고 집중적인 데이터 세트를 제공합니다. 보기 또는 메트릭 뷰를 사용하여 열 모호성을 해결하고 테이블을 미리 조인하거나 정규화 해제합니다. 간소화된 데이터 세트는 데이터 질문에 정확하게 답변하는 Genie의 능력을 향상시킵니다.
  • 텍스트 지침보다 SQL 식 및 예제 SQL 우선 순위 지정: SQL 식을 사용하여 메트릭 및 필터와 같은 비즈니스 의미 체계를 정의합니다. 예제 SQL을 사용하여 일반적인 모호한 프롬프트를 처리하는 방법을 Genie에 설명합니다. 구조화된 정의에 맞지 않는 일반 지침에 대한 텍스트 지침을 예약합니다.
  • 명확한 특정 텍스트 지침 작성: 모호한 지침을 피합니다. 예를 들어 "판매에 대해 질문할 때 명확한 질문"이 아니라 "사용자가 제품 이름 또는 판매 채널을 지정하지 않고 판매 메트릭에 대해 묻는 경우 다음을 묻습니다. 판매 분석을 진행하려면 제품 이름 및 판매 채널을 지정하십시오."
  • 충돌하는 명령 방지: 모든 명령 유형에서 일관성을 보장합니다. 예를 들어 텍스트 명령에서 소수 자릿수를 두 자리로 반올림하도록 지정하는 경우 예제 SQL 쿼리도 두 자리로 반올림해야 합니다.

다음 섹션에서는 공간을 구축하고 정확도 문제를 해결하기 위한 자세한 권장 사항을 제공합니다.

작게 시작

Genie 공간 큐레이팅은 반복적인 프로세스입니다. 새 공간을 만들 때는 최소한의 지침과 답변할 수 있는 제한된 질문 집합을 사용하여 가능한 한 작게 시작합니다. 그런 다음, 피드백 및 모니터링에 따라 반복할 때 추가할 수 있습니다. 이 접근 방법은 공간을 만들고 유지 관리하는 작업을 간소화하는 데 도움이 되며, 이 방법을 통해 실제 사용자 요구 사항에 따라 효과적으로 큐레이팅할 수 있습니다.

다음 지침을 사용하여 작은 Genie 공간을 만듭니다.

  • 집중하세요: 공간이 처리할 수 있도록 원하는 질문에 응답하기 위해 필요한 테이블만 포함하십시오. 5개 이하의 테이블을 목표로 합니다. 선택에 더 집중할수록 더 좋습니다. 적은 양의 데이터에 집중하는 것이 이상적이므로 포함된 테이블의 열 수를 제한합니다.
  • 25개 테이블 제한 내에서 작업: 지니 공간은 최대 25개 테이블 또는 뷰를 지원합니다. 데이터 토픽에 25개 이상의 테이블이 필요한 경우 관련 테이블을 뷰 또는 메트릭 뷰 에 미리 조인한 후 공간에 추가합니다. 메트릭 뷰는 메트릭, 차원 및 집계를 미리 정의하기 때문에 지니 공간에 특히 효과적입니다. 이 방법을 사용하면 제한을 벗어나고, 데이터 모델을 간소화하며, Genie의 응답 정확도를 향상시킬 수 있습니다. 공간에 데이터 개체 를 추가하는 방법에 대한 자세한 내용은 데이터 개체 관리를 참조하세요.
  • 반복 계획: 필수 테이블 및 기본 지침에 중점을 두고 공간을 최소로 설정하는 것으로 시작합니다. 처음에 완벽을 목표로 하는 대신 시간이 지남에 따라 공간을 구체화할 때 더 자세한 지침과 예제를 추가합니다.
  • 주석이 잘 추가된 테이블 빌드: Genie는 Unity 카탈로그 열 이름 및 설명을 사용하여 응답을 생성합니다. 열 이름과 설명이 명확하면 고품질 응답을 생성할 수 있습니다. 열 설명은 정확한 컨텍스트 정보를 제공해야 합니다. 모호하거나 불필요한 세부 정보를 방지합니다. AI에서 생성된 설명의 정확성과 명확성을 검사하고, 사용자가 수동으로 제공할 내용에 부합하는 경우에만 사용합니다.

분야 전문가가 공간 정의

효과적인 공간 작성자는 데이터 및 데이터로부터 얻을 수 있는 인사이트를 이해해야 합니다. SQL에 능숙한 데이터 분석가는 일반적으로 공간을 큐레이팅하는 지식과 기술을 가지고 있습니다.

공간의 용도 정의

공간의 특정 대상 그룹 및 용도를 식별하면 사용할 데이터, 지침 및 테스트 질문을 결정하는 데 도움이 됩니다. 공간은 다양한 분야의 일반적인 질문이 아니라 특정 주제 및 대상 그룹에 대한 질문에 답변해야 합니다. 공간에 데이터를 추가하기 전에 테이블을 미리 조인하고 불필요한 열을 제거하여 데이터 세트를 간소화할 수 있습니다. 공간에 데이터를 추가할 때 공간의 정의된 목적에 집중합니다. 혼동되거나 중요하지 않을 수 있는 열을 숨깁니다. 관련 열 숨기기 또는 표시를 참조하세요.

메타데이터 및 동의어 추가

지니 공간의 데이터에 열 동의어 및 사용자 지정 설명을 추가할 수 있습니다. 이 메타데이터는 지니 공간으로 범위가 지정되며 Unity 카탈로그에 저장된 메타데이터를 덮어쓰지 않습니다. 품질 열 설명 및 동의어는 Genie가 열을 더 잘 이해하고, 관련 질문에 대해 선택하고, 보다 정확한 SQL을 작성하는 데 도움이 됩니다. 열 메타데이터 편집을 참조하세요.

Genie 데이터 샘플링 사용

데이터 샘플링은 공간의 데이터 세트 값을 샘플링하여 Genie의 정확도를 향상시켜 사용자 프롬프트를 올바른 열 및 값과 더 잘 일치시키는 데 도움이 됩니다. Genie는 공간을 만들 때 테이블에서 값을 자동으로 샘플링합니다. 샘플링된 데이터가 있는 열을 관리할 수 있습니다. 보다 안정적인 지니 공간에 대한 데이터 개체 관리 및 지식 저장소 빌드를 참조하세요.

포커스가 있는 예제 및 지침 제공

지니 공간은 제한되고 집중된 지침 집합으로 가장 잘 수행됩니다. Databricks는 공간 내 지침을 제공하기 위해 예제 SQL 쿼리를 사용하는 것을 권장합니다. 예제 SQL 쿼리를 사용하면 Genie가 사용자 프롬프트를 확인된 SQL 쿼리와 일치시키고 예제에서 학습하여 관련 질문에 답변할 수 있습니다. 예제 SQL 쿼리 및 함수 추가를 참조하세요.

Genie 공간에서 전역적으로 적용해야 하는 컨텍스트의 경우 잘 구성된 작고 잘 구성된 일반 텍스트 명령 집합은 관련성을 유지하고 응답 품질을 개선하는 데 도움이 될 수 있습니다. 지니가 가장 중요한 지침의 우선 순위를 정하는 데 어려움을 겪을 수 있기 때문에 너무 많은 지침이 효과를 줄일 수 있습니다. 자세한 내용은 지침 제공을 참조하세요.

올바른 명령 유형 선택

다음 지침을 사용하여 SQL 식과 예제 SQL 쿼리 중에서 결정합니다.

  • 일반적인 비즈니스 용어에 SQL 식을 사용합니다. 표준 비즈니스 개념을 나타내는 자주 사용되는 메트릭, 필터 또는 차원을 정의할 때 지식 저장소에서 SQL 식을 사용합니다. SQL 식은 Genie가 비즈니스 논리를 이해하는 데 도움이 되는 효율적이고 재사용 가능한 정의입니다. 예를 들어 총이익, 최근 판매액 및 전환율이 있습니다. SQL 식 정의를 참조하세요.
  • 복잡한 질문에 대한 예제 SQL 쿼리 사용: 해석하기 어려운 여러 부분 또는 복잡한 질문을 해결할 때 전체 예제 SQL 쿼리를 제공합니다. 이러한 예제에서는 복잡한 쿼리 패턴 및 다단계 논리를 처리하는 방법을 Genie에 보여 줍니다. 예를 들어 "내 팀의 성과 분석" 또는 "최근에 참가한 고객의 경우 어떤 제품이 가장 잘 하고 있나요?"와 같은 프롬프트에 대한 SQL 쿼리를 만들 수 있습니다. 예제 SQL 쿼리 및 함수 추가를 참조하세요.

지니에게 해명 질문을 하라는 메시지를 표시합니다.

특정 시나리오에서 설명 질문을 하라는 메시지를 Genie에 표시하려면 설명 요청 시기와 후속 조치를 명시해야 합니다. 트리거 조건과 예상된 설명 동작을 모두 정의하는 명확하고 구체적인 지침을 사용합니다.

예를 들어 다음 유형의 명령을 공간에 추가합니다.

사용자가 판매 성과 분석에 대해 물어보지만 시간 범위, 판매 채널 또는 프롬프트에 KPI를 포함하지 않는 경우 필요한 정보를 수집하기 위해 먼저 설명 질문을 해야 합니다. 예: "원하는 시간 범위 및 판매 채널을 지정하세요."

다음 구성 요소를 사용하여 설명 지침을 구성합니다.

  • 트리거 조건: 설명이 필요한 토픽 또는 시나리오 정의(예: "사용자가 X 토픽에 대해 묻는 경우...")
  • 누락된 세부 정보: 있어야 하는 정보 지정(예: "... 하지만 Y 세부 정보를 포함하지 마세요...")
  • 필요한 작업: Genie가 설명을 요청해야 하며(예: "... 먼저 해명 질문을 해야 합니다...")
  • 예제 설명: Genie가 물어봐야 할 특정 질문 제공(예: "지정하세요...")

일반 지침의 끝에 설명 질문 지침을 추가하여 Genie가 모호한 질문에 응답할 때 이 동작의 우선 순위를 지정하는 데 도움이 됩니다.

테스트 및 조정

공간의 첫 번째 사용자여야 합니다. 새 공간을 만든 후 질문하기 시작합니다. 질문에 대한 응답으로 생성된 SQL을 신중하게 검토합니다. Genie가 데이터, 질문 또는 비즈니스 전문 용어를 잘못 해석하는 경우 생성된 SQL을 편집하거나 다른 특정 지침을 제공하여 개입할 수 있습니다. 신뢰할 수 있는 응답을 받을 때까지 테스트 및 편집을 계속합니다.

질문을 검토한 후에는 전체 정확도를 체계적으로 테스트하고 점수를 매기는 데 사용할 수 있는 벤치마크 질문으로 추가할 수 있습니다. 변형 및 다양한 질문 구문을 사용하여 Genie의 응답을 테스트할 수 있습니다. 지니 공간에서 벤치마크 사용을 참조하세요.

잘못된 응답을 수정하는 방법은 지니 공간 문제 해결을 참조하세요.

사용자 테스트 수행

테스트를 통해 응답 품질을 확인한 후 Genie 공간을 시도할 비즈니스 사용자를 모집합니다. 다음 지침을 사용하여 원활한 사용자 경험을 제공하고 지속적인 개선을 위한 피드백을 수집합니다.

  • 그들의 역할이 공간을 개선하는 것이라는 기대를 세우다.
  • 특정 주제와 공간에서 답하도록 설계된 질문에 집중해서 테스트하도록 요청하세요.
  • 잘못된 응답을 받는 경우 사용자가 채팅에 추가 지침 및 설명을 추가하여 답변을 구체화하도록 장려합니다. 향후 상호 작용에서 유사한 오류를 최소화하기 위해 올바른 응답이 제공되면 최종 쿼리를 추천해야 합니다.
  • 기본 제공 피드백 메커니즘을 사용하여 사용자에게 응답에 찬성하거나 반대하도록 지시합니다.
  • 추가 피드백 및 해결되지 않은 질문을 공간 작성자와 직접 공유하도록 사용자를 초대합니다. 작성자와 편집자는 피드백을 사용하여 지침, 예제 및 신뢰할 수 있는 자산을 구체화할 수 있습니다.

공간을 테스트하고 피드백을 제공하기 위한 지침이 포함된 교육 자료 또는 서면 문서를 제공하는 것이 좋습니다. 비즈니스 사용자가 지니 공간을 사용하여 비즈니스 데이터를 탐색 하여 새 Genie 공간 작업을 시작하도록 지시합니다.

비즈니스 사용자가 공간을 테스트할 때 CAN MANAGE 권한이 있는 사용자는 모니터링 탭에서 질문한 질문을 볼 수 있습니다. Genie가 질문과 데이터를 올바르게 해석하여 정확한 답변을 제공할 수 있도록 컨텍스트를 계속 추가합니다. 지니 공간 모니터링 에 대한 자세한 내용은 공간 모니터링을 참조하세요. 감사 로그를 사용하여 Genie 공간 피드백을 모니터링하고 요청을 검토할 수도 있습니다. 감사 로그 및 경고를 사용하여 AI/BI 사용 모니터링을 참조하세요.

Note

비즈니스 사용자는 공간에 액세스하려면 원래 작업 영역의 구성원이어야 합니다. 공간 상호 작용할 수 있는 적절한 권한을 제공하는 방법을 알아보려면 필수 권한을 참조하세요.

지니 공간과 관련된 일반적인 문제를 해결하려면 지니 공간 문제 해결을 참조하세요.