Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
O repositório de conhecimento do Genie permite que você faça a curadoria e aprimore seu espaço por meio de metadados localizados, amostragem de valor e instruções estruturadas do SQL. Esses recursos ajudam o Genie a entender seus dados e gerar respostas mais precisas e relevantes.
O que é um repositório de conhecimento?
Um repositório de conhecimento é uma coleção de definições semânticas selecionadas que aprimora a compreensão do Genie sobre seus dados e melhora a precisão da resposta.
O repositório de conhecimento consiste em:
- Customização de metadados no nível de espaço: descrições específicas para tabelas, colunas e termos e sinônimos de negócios.
- Personalização de dados em nível espacial: conjuntos de dados simplificados e focados sem alterar as tabelas subjacentes do Unity Catalog
- Amostragem de valor: exemplos de dados reais que ajudam o Genie a entender os tipos de dados e corresponder os prompts do usuário aos valores reais
-
Relações de junção: relações de tabela definidas para instruções precisas
JOIN - Expressões SQL: definições estruturadas de medidas, filtros e dimensões que capturam a lógica de negócios
Todas as configurações do repositório de conhecimento têm como escopo o espaço do Genie e não afetam os metadados do Catálogo do Unity ou outros ativos do Azure Databricks.
Gerenciar metadados do repositório de conhecimento
Ensine o Genie sobre os dados em seu espaço fornecendo descrições de tabelas e colunas locais e adicionando sinônimos de coluna que se alinham aos termos de negócios comuns. Simplifique os conjuntos de dados ocultando colunas desnecessárias ou duplicadas para manter o Genie focado.
Essas práticas melhoram a usabilidade para usuários que não têm permissões diretas nas tabelas subjacentes e também dão suporte a iterações mais rápidas ao atualizar versões de instrução.
Para acessar metadados no nível do espaço, clique em Configurar > Dados no espaço do Genie. Em seguida, clique em um nome de tabela para exibir seus metadados e colunas.
Exibir colunas
Clique em um nome de tabela para ver uma visão geral dos nomes e detalhes da coluna. O exemplo a seguir mostra um exemplo de uma tabela chamada accounts.
Descrição: O Genie usa metadados para entender seus dados e gerar respostas precisas. A descrição da tabela padrão mostra os metadados do Catálogo do Unity associados ao ativo de dados. Você pode editar essa descrição para adicionar instruções específicas que ajudam o Genie a criar o SQL para seu espaço. Clique em Redefinir para restaurar a descrição do Unity Catalog.
Colunas: Nomes e descrições de colunas são incluídos na lista de colunas. Cada coluna é rotulada com marcas que mostram se ela inclui valores de exemplo ou um dicionário de valor. Confira a visão geral da amostragem de valor.
Ocultar ou mostrar colunas relevantes
As colunas podem ser gerenciadas individualmente ou em massa. Use as instruções a seguir para ocultar ou mostrar colunas.
-
Ocultar uma única coluna: clique no
ao lado do nome da coluna. -
Ocultar várias colunas:
- Marque as caixas de seleção das colunas que você deseja ocultar.
- No menu Ações , selecione Ocultar colunas selecionadas.
- Desfazer alterações: repita as mesmas etapas para mostrar uma coluna oculta.
Editar metadados de coluna
Você pode personalizar o seguinte para cada coluna:
- Descrição: descrições de colunas específicas do ambiente que aprimoram a compreensão do Genie.
- Sinônimos: termos de negócios e palavras-chave que ajudam a corresponder a linguagem do usuário com nomes de coluna.
-
Configurações avançadas: controles de amostragem de valor.
- Valores de exemplo: ativar ou desativar a amostragem automática de valores representativos.
- Construir dicionário de valores: habilitar ou desabilitar dicionários de valores para colunas categóricas.
Para editar metadados de coluna:
- Clique no
Ícone de lápis ao lado de um nome de coluna.
- Edite a descrição e os sinônimos da coluna.
- Se necessário, clique em Configurações avançadas para abrir controles de amostragem de valor.
- Clique em Salvar para manter suas alterações e fechar a caixa de diálogo.
Visão geral da amostragem de valor
A amostragem de valor aprimora a capacidade do Genie de entender e trabalhar com seus dados reais coletando exemplos representativos.
A amostragem de valor melhora a geração de SQL do Genie fornecendo acesso a valores reais de dados. Quando os usuários fazem perguntas conversacionais com erros de ortografia ou terminologia variada, a amostragem de valor ajuda o Genie a alinhar os prompts com os valores reais dos dados em suas tabelas.
Componentes de amostragem de valor
- Valores de exemplo: pequenos exemplos de cada coluna que ajudam o Genie a entender os tipos de dados e a formatação. Elas são coletadas automaticamente para todas as colunas qualificadas.
- Dicionários de valor: listas com curadoria de até 1.024 valores distintos por coluna (menos de 127 caracteres cada). Criado para até 120 colunas que contêm valores de cadeia de caracteres categóricos ou consistentemente formatados, como estados, categorias de produto ou códigos de status.
Tabelas com filtros de linha ou máscaras de coluna são excluídas da amostragem de valor.
Gerenciar amostragem de valor
Controle quais colunas fornecem valores de exemplo e dicionários de valor para otimizar a compreensão do Genie sobre seus dados. A amostragem de valor é habilitada por padrão para todos os espaços do Genie.
Gerenciar valores de exemplo
Os valores de exemplo são adicionados automaticamente quando você adiciona tabelas a um espaço do Genie.
Para desativar valores de exemplo para uma coluna:
- Clique em Configurar > Dados no seu espaço do Genie.
- Clique em um nome de tabela para exibir suas colunas.
- Clique no
Ícone de lápis ao lado do nome da coluna.
- Clique em Avançado.
- Desative os valores de exemplo.
Essa ação desabilita automaticamente a criação de um dicionário de valores para essa coluna. Se necessário, use essa configuração para ativar os valores de exemplo novamente.
Configurar dicionários de valores
O Genie seleciona automaticamente colunas para amostragem de valor quando você adiciona dados a um espaço. Você pode gerenciar manualmente quais colunas têm dicionários de valor habilitados. Escolha colunas de cadeia de caracteres com valores categóricos ou estruturados para obter os melhores resultados. Evite colunas de texto livre, como IDs de usuário, nomes ou revisões de usuário.
O Genie impede que você habilite dicionários de valor em tabelas com filtros de linha ou máscaras de coluna. No entanto, os autores de espaço devem desabilitar dicionários de valor para exibições que referenciam tabelas com filtros de linha ou máscaras de coluna, ou para exibições dinâmicas.
A lista a seguir inclui exemplos dos tipos de dados que funcionam bem com dicionários de valor:
- Códigos de estado ou país
- Categorias de produto
- Códigos de status
- Nomes de departamento
Para habilitar um dicionário de valores:
- Clique no
Ícone de lápis ao lado do nome da coluna.
- Clique em Avançado.
- Ative o dicionário de valores de construção.
Atualizar valores de exemplo
Atualizar valores de exemplo verifica novamente seus dados e coleta novos valores para valores de exemplo e dicionários de valores.
Você deve atualizar os valores de exemplo nos seguintes casos:
- Novos valores foram adicionados à coluna
- O formato dos valores existentes foi alterado
Para atualizar valores armazenados:
- Clique no
Menu kebab no modo de exibição de coluna
- Selecione Atualizar valores de exemplo
Definir relações de associação
Ajude Genie a criar instruções precisas JOIN definindo relacionamentos de tabela:
- Clique em Conexões.
- Clique em Adicionar.
- Selecione tabelas à esquerda e à direita nos menus suspensos.
- Insira uma condição de junção (por exemplo,
accounts.id = opportunity.accountid)- (Opcional) Para condições de junção mais complicadas, use uma expressão SQL. Clique em Usar expressão SQL e grave a condição de junção como uma expressão SQL.
- Selecione um tipo de relação:
- Muitos para um: múltiplas linhas à esquerda são mapeadas para uma à direita
- Um para muitos: Uma linha à esquerda é mapeada para várias linhas à direita
- Um para um: uma linha esquerda corresponde, no máximo, a uma linha à direita
Observação
Quando várias junções existem entre as mesmas tabelas ou autojunções são usadas, o Genie gera automaticamente aliases para a tabela à direita para evitar ambiguidade.
Obter sugestões de comentários
Quando os usuários clicam em curtir em uma mensagem que une tabelas ou usa expressões SQL, o Genie analisa a resposta e pode sugerir novos trechos de SQL (como medidas, junções ou filtros) para revisão e possível adição ao repositório de conhecimento pelos autores do espaço. O Genie não aprende ou altera automaticamente seu comportamento com base nos comentários.
Definir expressões SQL
As expressões SQL fornecem uma maneira estruturada e guiada de ensinar o Genie sobre termos de negócios comuns, como KPIs, atributos e condições. O Genie pode usar cada uma dessas definições granulares quando um usuário perguntar sobre elas.
As expressões SQL complementam consultas SQL de exemplo, especificadas nas instruções. Embora as expressões SQL definam conceitos de negócios reutilizáveis, as consultas SQL de exemplo são mais úteis para ensinar o Genie a abordar formatos comuns de prompt do usuário. Por exemplo, se os usuários geralmente solicitam "uma divisão de desempenho", uma consulta SQL de exemplo pode mostrar que isso significa vendas fechadas por região, representante de vendas e gerente.
As expressões SQL funcionam melhor quando você precisa:
- Forneça definições estruturadas para KPIs e métricas, como margem de lucro ou taxa de conversão
- Dar contexto explícito ao Genie sobre como calcular valores importantes
- Definir dimensões adicionais para o conjunto de dados, como o segmento de mês ou cliente
- Configurar filtros do Genie para condições comerciais, como pedidos grandes ou pedidos antes de um horário específico
Tipos de expressão SQL
Você pode definir os seguintes tipos de expressões SQL:
- Medidas: KPIs (indicadores principais de desempenho) e métricas. Defina o nome, o cálculo do SQL e os sinônimos.
- Filtros: condições comuns de filtragem. Defina o nome, a lógica do filtro SQL e os sinônimos.
- Dimensões: atributos para agrupar e analisar dados. Defina o nome, a expressão SQL e os sinônimos.
Use as instruções a seguir para definir expressões SQL:
- Clique em Configurar>Instruções>Expressões SQL
- Clique em Adicionar. Escolha Filtro, Medida ou Dimensão.
- No campo Nome , insira um nome para a expressão.
- No campo Código , insira a expressão SQL.
- Expressões de filtro devem ser avaliadas como uma condição booliana.
- As expressões de medida devem calcular uma agregação em várias linhas na tabela.
- As expressões de dimensão devem alterar o valor de cada linha dos dados existentes.
- No campo Sinônimos, insira maneiras comuns de os usuários se referirem às expressões coloquialmente.
- No campo Instruções, insira instruções específicas que informem ao Genie para que serve a expressão e como trabalhar com ela.
Próximas etapas
Use os links a seguir para ajudá-lo a continuar a criar seu espaço do Genie.
- Adicione contexto ao seu espaço do Genie para ajudar a gerar respostas precisas. Veja Adicionar exemplos e instruções do SQL
- Conheça as práticas recomendadas para otimizar o espaço do Genie. Confira a curadoria de um espaço Genie eficaz
- Avalie e melhore o desempenho do espaço. Consulte Usar parâmetros de comparação em um espaço do Genie