다음을 통해 공유


지니 공간 문제 해결

이 페이지에서는 지니 공간을 만들고 유지 관리할 때 발생하는 일반적인 문제를 해결하는 방법을 간략하게 설명합니다.

오해의 소지가 있는 비즈니스 전문 용어

대부분의 회사 또는 분야에는 비즈니스 관련 이벤트에 대해 통신하는 데 사용하는 특정 약어가 있습니다. 예를 들어 연도를 언급할 때 항상 회계 연도를 의미할 수 있으며, 이 회계 연도는 1월이 아닌 2월 또는 3월에 시작될 수 있습니다. Genie가 이러한 질문에 자연스럽고 정확하게 답변할 수 있도록 하려면 비즈니스 전문 용어를 Genie가 이해할 수 있는 단어와 개념에 명시적으로 매핑하는 지침을 포함합니다. 지침 제공을 참조하세요.

잘못된 테이블 또는 열 사용

Genie가 잘못된 테이블에서 데이터를 가져오거나 잘못된 열에 대한 분석을 실행하려는 경우 다음 방법 중 하나로 데이터를 조정할 수 있습니다.

  • 명확하고 정확한 설명 제공: 테이블 및 관련 메타데이터를 확인하여 사용된 용어가 제출된 질문에서 사용자의 용어와 일치하는지 확인합니다. 그렇지 않은 경우 설명을 구체화하거나 테이블에 사용된 용어를 질문에 사용된 용어에 매핑하는 지침을 추가합니다.
  • 예제 쿼리 추가: Genie가 특정 질문에 응답하는 방법을 알아보는 데 사용할 수 있는 샘플 SQL 쿼리를 제공합니다. 지침 제공을 참조하세요.
  • 공간에서 테이블 또는 열 제거: 일부 테이블에는 Genie가 응답에 사용할 데이터를 알기 어렵게 만드는 겹치는 열 또는 개념이 포함될 수 있습니다. 가능하면 불필요하거나 겹치는 테이블 또는 열을 제거합니다. 기본 데이터 개체를 변경하지 않고 지니 공간 UI에서 열을 숨기려면 관련 열 숨기기 또는 표시를 참조하세요.

필터링 오류

생성된 쿼리에는 특정 값에 따라 결과를 필터링하는 WHERE 절이 종종 포함됩니다. Genie가 데이터 값에 대한 가시성이 없을 때, 잘못된 값을 필터링하도록 Genie가 절을 WHERE로 설정할 수 있습니다. 예를 들어 테이블에서 "CA"와 같은 약어를 사용하는 경우 "California"라는 이름과 일치하려고 할 수 있습니다.

이와 같은 경우 관련 열에 예제 값값 사전이 사용하도록 설정되어 있는지 확인합니다. 관련 테이블에 새 데이터가 추가된 경우 값을 새로 고칩니다. 보다 안정적인 지니 공간에 대한 지식 저장소 빌드를 참조하세요.

잘못된 조인

외래 키 참조가 Unity 카탈로그에 정의되지 않은 경우 공간은 서로 다른 테이블을 함께 조인하는 방법을 모를 수 있습니다.

다음 솔루션 중 하나 이상의 구현을 시도합니다.

  • 가능하면 Unity 카탈로그에서 외래 키 참조를 정의합니다. CONSTRAINT 조항참조하세요.
  • 테이블의 외래 키 관계가 Unity 카탈로그에 지정되지 않은 경우 Genie 공간의 지식 저장소에서 조인 관계를 정의합니다. 이 전략은 자체 조인과 같은 더 복잡한 조인 시나리오 또는 기본 테이블을 수정할 수 있는 충분한 권한이 없는 경우에 유용합니다. 조인 관계 정의를 참조하세요.
  • 테이블을 표준 방식으로 조인하는 예제 쿼리를 제공합니다.

이 중 어느 것도 문제를 해결하지 못하면, 테이블을 보기에 미리 조인한 후 그것을 공간의 입력으로 사용합니다.

외부 테이블의 열 주석이 동기화되지 않음

Azure Databricks는 외세 테이블에 대한 쓰기에 대한 메타데이터, 데이터 또는 의미 체계를 관리하지 않습니다. 원본 테이블에 따라 Azure Databricks에서 주석에 액세스할 수 없을 수 있습니다. 댓글을 사용할 수 있도록 Azure Databricks는 다음 중 하나를 수행하는 것이 좋습니다.

  • Genie 공간 UI에서 열 메타데이터를 편집합니다. 편집된 메타데이터는 작성된 지니 공간에만 적용됩니다. 열 메타데이터 편집을 참조하세요.
  • 페더레이션 테이블 위에 구체화된 뷰를 만듭니다. 관리되는 테이블에서와 마찬가지로 구체화된 뷰에서 주석을 추가하고 편집할 수 있습니다. 여러 지니 공간에서 이 보기를 다시 사용할 수 있습니다. 외세의 테이블에서 구체화된 뷰로 데이터를 로드하는 방법에 대한 자세한 내용은 구체화된 뷰를 사용하여 외세의 테이블에서 데이터 로드를 참조하세요. 구체화된 뷰 작업에 대한 자세한 내용은 구체화된 뷰를 참조하세요.

메트릭 계산 문제

메트릭을 계산하고 롤업하는 방식은 임의로 복잡할 수 있으며 공간에서 이해하지 못하는 많은 비즈니스 세부 정보를 포함할 수 있습니다. 이로 인해 잘못 보고할 수 있습니다.

다음 솔루션 중 하나 이상의 구현을 시도합니다.

  • 지식 저장소에서 메트릭을 SQL 식으로 정의합니다. SQL 식은 Genie가 일관되게 적용할 수 있는 측정값, 필터 및 차원에 대해 재사용 가능하고 정확한 정의를 제공합니다. SQL 식 정의를 참조하세요.
  • 메트릭이 기본 테이블에서 집계되는 경우 각 롤업 값을 계산하는 예제 SQL 쿼리를 제공합니다.
  • 메트릭이 미리 계산되어 집계된 테이블에 있는 경우 테이블 메모에서 이를 설명합니다. 해당 테이블의 메트릭을 추가로 롤업할 수 있는 경우 각 메트릭에 대해 유효한 집계를 지정합니다.
  • 생성하려는 SQL이 매우 복잡한 경우 공간에 대한 메트릭을 이미 집계한 보기를 만들어 보세요.

잘못된 시간 기반 계산

지니는 데이터에 표시된 표준 시간대나 분석이 수행되어야 하는 표준 시간대를 명확히 알지 못할 수 있습니다. 따라서 추가적인 지침을 명시적으로 제공하지 않으면, 올바른 시간대를 유추하는 것이 항상 가능한 것은 아닙니다.

원래 원본 표준 시간대, 변환 함수 및 대상 표준 시간대를 자세히 설명하는 보다 명시적인 지침을 포함합니다. 다음 예제에서는 보다 안정적인 표준 시간대 변환에 대한 일반 지침을 변경하는 방법을 보여 줍니다.

  • 항상 시간을 특정 시간대로 변환하십시오. 이 예제에서는 원본 타임스탬프가 UTC이며, America/Los_Angeles 시간대에서 결과를 얻고자 합니다. 설명서에 다음을 추가하여 적절한 열 이름으로 <timezone-column>를 바꿉니다.
    • 테이블의 시간대는 UTC기준입니다.
    • 다음 함수를 사용하여 모든 표준 시간대를 변환합니다. convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>).
  • UTC가 아닌 날짜/시간 형식을 UTC로 변환: 작업 영역 기본 표준 시간대가 UTC 지만 로스앤젤레스의 사용자가 특정 레코드 집합에 대해 오늘 참조해야 하는 경우 공간의 일반 지침에 다음을 추가합니다.
    • 오늘을 참조하려면 date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp()))을 사용하세요.

자세한 내용 및 구문은 함수를 참조 convert_timezone 하세요.

지침 무시

메모에서 테이블과 열을 설명하고 일반 지침을 제공했더라도 공간이 여전히 이를 제대로 사용하지 못할 수 있습니다.

다음 전략 중 하나 이상을 시도합니다.

  • 테이블을 올바르게 사용하는 예제 쿼리를 제공합니다. 예제 쿼리는 데이터를 사용하는 방법을 공간에 가르치는 데 특히 효과적입니다.
  • 지니 공간에서 관련 없는 열을 숨깁니다. 관련 열 숨기기 또는 표시를 참조하세요.
  • 테이블에서 데이터를 보다 간단하게 볼 수 있는 뷰를 만드세요.
  • 지침을 검토하고 관련 없는 테이블 또는 지침을 제거하여 공간에 집중해 보세요.
  • 새 채팅을 시작해 보세요. 이전 상호 작용은 지정된 채팅에서 Genie의 응답에 영향을 줄 수 있지만 새 채팅을 시작하면 새 지침을 테스트하기 위한 빈 시작점이 제공됩니다.

성능 문제

Genie가 매우 긴 쿼리 또는 텍스트 응답을 생성해야 하는 경우 사고 단계에서 응답하는 데 시간이 오래 걸리거나 제한 시간이 초과될 수 있습니다.

성능을 개선하기 위해 다음 작업 중 하나 이상을 시도합니다.

  • 쿼리 기록을 확인하여 느리게 실행되는 쿼리를 식별합니다. Genie 공간 구성을 수정하는 대신 생성된 SQL 쿼리를 최적화하여 많은 성능 문제를 해결할 수 있습니다. SQL Warehouse의 쿼리 기록에서 쿼리 실행 시간 및 쿼리 계획을 검토하여 병목 상태 및 최적화 기회를 식별합니다.
  • 신뢰할 수 있는 자산 또는 보기를 사용하여 복잡한 쿼리를 캡슐화합니다. AI/BI Genie 공간에서 신뢰할 수 있는 자산 사용을 참조하세요.
  • 가능하면 예제 SQL 쿼리의 길이를 줄입니다.
  • Genie가 느리거나 실패한 응답을 생성하기 시작하면 새 채팅을 시작합니다.

중요 업무용 질문에 대한 신뢰할 수 없는 응답

신뢰할 수 있는 자산을 사용하여 사용자가 질문할 것으로 예상되는 특정 질문에 대한 검증된 답변을 제공합니다. AI/BI Genie 공간에서 신뢰할 수 있는 자산 사용을 참조하세요.

토큰 제한 경고

토큰은 Genie가 언어를 처리하고 이해하는 데 사용하는 텍스트의 기본 단위입니다. 지니 공간의 텍스트 명령 및 메타데이터는 토큰으로 변환됩니다. 공간이 토큰 제한에 가까워지면 경고가 나타납니다. Genie는 컨텍스트 필터링을 사용하여 질문과 가장 관련이 있다고 생각하는 토큰의 우선 순위를 지정합니다. 경고가 표시되면 응답이 계속 생성되지만 중요한 컨텍스트를 필터링하면 품질이 저하될 수 있습니다. 토큰 제한을 초과하면 더 이상 Genie 공간에서 메시지를 보내거나 받을 수 없습니다.

토큰 수를 줄이려면 다음 방법을 고려하세요.

  • 불필요한 열 제거: 테이블의 불필요한 열이 토큰 사용에 크게 영향을 미칠 수 있습니다. 가능하면 원시 테이블에서 중복 또는 필수적이지 않은 필드를 제외하는 뷰를 만듭니다. Genie 공간에서 불필요한 열을 숨길 수도 있습니다. 관련 열 숨기기 또는 표시를 참조하세요.
  • 열 설명 간소화: 열 설명은 중요하지만 열 이름으로 이미 전달된 정보가 중복되지 않도록 합니다. 예를 들어 열의 이름이 지정된 account_name경우 "계정 이름"과 같은 설명은 중복될 수 있으며 생략할 수 있습니다.
  • Genie 공간에서 열 메타데이터 편집: 설명을 편집하고 열 메타데이터 의 동의어를 제공하는 방법을 알아보려면 열 메타데이터 편집을 참조하세요.
  • 예제 SQL 쿼리 정리: 다양한 유형의 질문을 처리하지만 겹치거나 중복되는 예제를 제거하기 위해 다양한 범위의 예제 SQL 쿼리를 포함합니다.
  • 지침 간소화: 지침이 명확하고 간결한지 확인합니다. 불필요한 단어를 사용하지 않습니다.

귀하의 계정은 지역 간 처리를 사용할 수 없도록 설정되어 있습니다.

Genie는 Azure Databricks 에서 관리하는 지정된 서비스 입니다. 지정된 서비스는 Databricks Geos를 사용하여 데이터 상주를 관리합니다. 일부 지역의 작업 영역과 동일한 지역에서는 데이터를 처리할 수 없습니다. 작업 영역이 해당 지역 중 하나에 있는 경우 계정 관리자가 지역 간 처리를 사용하도록 설정해야 합니다.

처리량 제한에 도달

Azure Databricks UI를 통해 Genie 공간에 액세스할 때 처리량은 모든 Genie 공간에서 작업 영역당 분당 20개의 질문으로 제한됩니다.

Conversation API의 무료 계층(공개 미리 보기)을 사용하여 Genie 공간에 액세스할 때 처리량은 모든 Genie 공간에서 작업 영역당 분당 5개의 질문으로 제한됩니다. Genie API를 사용하여 Genie를 애플리케이션에 통합하는 방법을 참조하세요.