Partilhar via


Resolução de problemas nos espaços Genie

Esta página descreve como resolver problemas comuns ao criar e manter espaços Genie.

Jargão empresarial incompreendido

A maioria das empresas ou domínios tem uma abreviatura específica que usam para comunicar sobre eventos específicos do negócio. Por exemplo, quando se refere a um ano, pode sempre significar o ano fiscal, e este ano fiscal pode começar em fevereiro ou março em vez de janeiro. Para permitir que o Genie responda a essas perguntas de forma natural e precisa, inclua instruções que mapeiam explicitamente o jargão do seu negócio para palavras e conceitos que o Genie pode entender. Consulte Fornecer instruções.

Uso incorreto de tabelas ou colunas

Se o Genie estiver tentando extrair dados de uma tabela incorreta ou executar análises em colunas incorretas, você poderá ajustar os dados de uma das seguintes maneiras:

  • Forneça descrições claras e precisas: verifique suas tabelas e metadados associados para verificar se a terminologia usada corresponde à terminologia dos usuários nas perguntas enviadas. Caso contrário, refine a descrição ou adicione uma instrução que mapeie a terminologia usada na tabela para a terminologia usada na pergunta.
  • Adicionar consultas de exemplo: forneça consultas SQL de exemplo que o Genie pode usar para aprender a responder a determinadas perguntas. Consulte Fornecer instruções.
  • Remover tabelas ou colunas do espaço: algumas tabelas podem incluir colunas ou conceitos sobrepostos que tornam difícil para o Genie saber quais dados usar em uma resposta. Se possível, remova tabelas ou colunas desnecessárias ou sobrepostas. Para esconder colunas da interface espacial do Genie sem alterar os objetos de dados subjacentes, veja Ocultar ou mostrar colunas relevantes.

Erros de filtragem

As consultas geradas geralmente incluem uma WHERE cláusula para filtrar os resultados de acordo com um valor específico. Quando o Genie não tem visibilidade dos valores de dados, ele pode definir a WHERE cláusula para filtrar o valor errado. Por exemplo, pode tentar associar o nome "California" quando a tabela usa abreviaturas como "CA."

Para situações como esta, verifique se as colunas relevantes têm valores de exemplo e dicionários de valor habilitados . Se novos dados tiverem sido adicionados a tabelas relevantes, atualize os valores. Consulte Criar um repositório de conhecimento para espaços Genie mais confiáveis.

Junções incorretas

Se as referências de chave estrangeira não estiverem definidas no Catálogo Unity, seu espaço pode não saber como unir diferentes tabelas.

Tente implementar uma ou mais das seguintes soluções:

  • Defina referências de chaves estrangeiras em seu catálogo Unity quando possível. Consulte a cláusula CONSTRAINT.
  • Se as relações de chave estrangeira das suas tabelas não estiverem especificadas no Unity Catalog, defina relações de junção no armazenamento de conhecimento do seu espaço Genie. Essa estratégia é útil para cenários de junção mais complexos, como auto-uniões, ou se não tem permissões suficientes para modificar as tabelas base. Consulte Definir relações de junção.
  • Forneça consultas de exemplo em que você une tabelas de maneiras padrão.

Se nenhum deles resolver o problema, pré-junte a tabela em um modo de exibição e use-o como entrada para o espaço.

Comentários de coluna não sincronizados de tabelas estrangeiras

O Azure Databricks não gerencia os metadados, dados ou semântica para gravações em tabelas estrangeiras. Dependendo da tabela de origem, os comentários podem não estar acessíveis a partir do Azure Databricks. Para disponibilizar comentários, o Azure Databricks recomenda seguir um destes procedimentos:

  • Editar metadados de coluna na interface de utilizador do espaço Genie. Os metadados editados aplicam-se apenas ao espaço Genie onde são gravados. Consulte Editar metadados da coluna.
  • Crie vistas materializadas sobre tabelas federadas. Você pode adicionar e editar comentários em uma exibição materializada como faria em uma tabela gerenciada. Você pode reutilizar essa visualização em vários espaços do Genie. Para obter detalhes sobre como carregar dados de tabelas estrangeiras para uma exibição materializada, consulte Carregar dados de tabelas estrangeiras com exibições materializadas. Para saber mais sobre como trabalhar com modos de exibição materializados, consulte Modos de exibição materializados.

Problemas de cálculo métrico

A maneira como as métricas são calculadas e acumuladas pode ser arbitrariamente complicada e abranger muitos detalhes de negócios que o seu ambiente não entende. Isso pode levar a relatórios incorretos.

Tente implementar uma ou mais das seguintes soluções:

  • Defina as suas métricas como expressões SQL na loja de conhecimento. As expressões SQL fornecem definições precisas e reutilizáveis para medidas, filtros e dimensões que o Genie pode aplicar de forma consistente. Veja Definir expressões SQL.
  • Se as suas métricas forem agregadas a partir de tabelas base, forneça exemplos de consultas SQL computando cada valor de agregação.
  • Se suas métricas foram pré-calculadas e estão em tabelas agregadas, explique isso nos comentários da tabela. Especifique agregações válidas para cada métrica se as métricas nessa tabela puderem ser agregadas.
  • Se o SQL que você está tentando gerar for muito complicado, tente criar exibições que já tenham agregado suas métricas para o seu espaço.

Cálculos baseados no tempo incorretos

O Genie nem sempre pode inferir o fuso horário representado nos dados ou o fuso horário no qual sua análise precisa ser executada, a menos que você forneça explicitamente orientação adicional.

Inclua instruções mais explícitas detalhando o fuso horário de origem original, a função de conversão e o fuso horário de destino. Os exemplos a seguir mostram como alterar as instruções gerais para conversões de fuso horário mais confiáveis:

  • Sempre converta horários em um fuso horário específico: Neste exemplo, suponha que o carimbo de data/hora de origem é UTC e você deseja resultados no fuso horário America/Los_Angeles. Adicione o seguinte às instruções, substituindo <timezone-column> pelo nome da coluna apropriado:
    • Os fusos horários nas tabelas estão em UTC.
    • Converta todos os fusos horários usando a seguinte função: convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>).
  • Converter formatos de data/hora não UTC para UTC: Se o fuso horário padrão do espaço de trabalho for UTC mas os usuários em Los Angeles precisarem fazer referência hoje para um conjunto específico de registros, adicione o seguinte às instruções gerais do espaço:
    • Para fazer referência hoje, use date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp())).

Consulte convert_timezone função para obter mais detalhes e sintaxe.

Ignorando instruções

Mesmo que você tenha explicado suas tabelas e colunas nos comentários e fornecido instruções gerais, seu espaço ainda pode não estar usando-as corretamente.

Tente uma ou mais das seguintes estratégias:

  • Forneça exemplos de consultas que usam suas tabelas corretamente. Exemplos de consultas são especialmente eficazes para ensinar o seu ambiente a utilizar os seus dados.
  • Oculte colunas irrelevantes no espaço Genie. Consulte Ocultar ou mostrar colunas relevantes.
  • Crie vistas a partir das suas tabelas que fornecem uma vista mais simples dos seus dados.
  • Reveja as suas instruções e tente concentrar o espaço removendo tabelas ou instruções irrelevantes.
  • Tente iniciar um novo bate-papo. Interações anteriores podem influenciar as respostas do Genie em qualquer chat, mas iniciar um novo bate-papo oferece um ponto de partida em branco para testar novas instruções.

Problemas de desempenho

Quando o Genie precisa gerar consultas excepcionalmente longas ou respostas de texto, pode levar muito tempo para responder ou até mesmo pode ocorrer um timeout durante a fase de processamento.

Tente uma ou mais das seguintes ações para melhorar o desempenho:

  • Verifique o histórico de consultas para identificar consultas que demoram a executar. Muitos problemas de desempenho podem ser resolvidos otimizando as consultas SQL geradas em vez de modificar a configuração do espaço Genie. Revise os tempos de execução das consultas e os planos de consulta no histórico de consultas do seu SQL warehouse para identificar gargalos e oportunidades de otimização.
  • Utilize ativos ou visões confiáveis para encapsular consultas complexas. Consulte o uso de ativos confiáveis nos espaços AI/BI Genie.
  • Reduza o comprimento de suas consultas SQL de exemplo sempre que possível.
  • Inicie um novo bate-papo se o Genie começar a gerar respostas lentas ou com falha.

Respostas não confiáveis a perguntas de missão crítica

Use ativos confiáveis para fornecer respostas verificadas a perguntas específicas que você espera que os usuários façam. Consulte o uso de ativos confiáveis nos espaços AI/BI Genie.

Aviso de limite de token

Os tokens são as unidades básicas de texto que o Genie usa para processar e entender a linguagem. Instruções de texto e metadados em um espaço Genie são convertidos em tokens. Se o seu espaço se aproximar do limite de tokens, será exibido um aviso. O Genie usa filtragem de contexto para priorizar os tokens que considera mais relevantes para uma pergunta. Embora as respostas ainda devam ser geradas quando um aviso aparece, a qualidade pode ser reduzida se o contexto importante for filtrado. Quando o limite de token é excedido, você não pode mais enviar ou receber mensagens no espaço Genie.

Considere as seguintes práticas para reduzir a contagem de tokens:

  • Remover colunas desnecessárias: colunas desnecessárias em suas tabelas podem contribuir significativamente para o uso de tokens. Quando possível, crie exibições para excluir campos redundantes ou não essenciais de suas tabelas brutas. Você também pode ocultar colunas desnecessárias em um espaço Genie. Consulte Ocultar ou mostrar colunas relevantes.
  • Simplifique as descrições das colunas: embora as descrições das colunas sejam importantes, evite duplicar as informações já transmitidas pelos nomes das colunas. Por exemplo, se uma coluna tiver um nome account_name, uma descrição como "o nome da sua conta" pode ser redundante e pode ser omitida.
  • Editar metadados de coluna no espaço Genie: consulte Editar metadados de coluna para saber como editar descrições e fornecer sinônimos em metadados de coluna.
  • Prune consultas SQL de exemplo: inclua uma gama diversificada de consultas SQL de exemplo para cobrir vários tipos de perguntas, mas remova exemplos sobrepostos ou redundantes.
  • Simplifique as instruções: verifique se as instruções são claras e concisas. Evite palavras desnecessárias.

A sua conta não está ativada para processamento geográfico cruzado

O Genie é um Serviço Designado gerenciado pelo Azure Databricks. Os Serviços Designados usam o Databricks Geos para gerenciar a residência de dados. Os dados não podem ser processados na mesma área geográfica que o espaço de trabalho em certas regiões. Se o espaço de trabalho estiver em uma dessas regiões, o processamento geográfico cruzado deverá ser habilitado pelo administrador da conta.

Atingir os limites de throughput

Ao aceder aos espaços do Genie através da interface do Azure Databricks, a taxa de transferência está limitada a 20 perguntas por minuto por espaço de trabalho, em todos os espaços do Genie.

Ao acessar espaços do Genie usando o nível gratuito da API de conversação (visualização pública), a taxa de transferência é limitada a um melhor esforço de cinco perguntas por minuto por espaço de trabalho, em todos os espaços do Genie. Consulte Usar a API do Genie para integrar o Genie em seus aplicativos.