Compartilhar via


Criar um agente de dados do Fabric (versão prévia)

Com um agente de dados no Microsoft Fabric, você pode criar experiências de IA de conversa que respondam a perguntas sobre dados armazenados em lakehouses, warehouses, modelos semânticos do Power BI, bancos de dados KQL e ontologias no Fabric. Seus colegas podem fazer perguntas em inglês sem formatação e receber respostas controladas por dados, mesmo que não sejam especialistas em IA ou profundamente familiarizados com os dados.

Importante

Esse recurso está na versão prévia.

Pré-requisitos

Autenticação e tokens

Você não precisa criar ou fornecer uma chave do Azure OpenAI ou um token de acesso para usar um agente de dados do Fabric. O Fabric usa um Assistente do Azure OpenAI gerenciado pela Microsoft e manipula a autenticação para você.

  • O acesso a dados é executado em sua identidade de usuário do Microsoft Entra ID e suas permissões de workspace/dados. O agente lê esquemas e executa SQL/DAX/KQL somente se você tiver acesso.
  • Para adicionar um modelo semântico do Power BI como uma fonte de dados, você precisa de permissão de Leitura nesse modelo (a permissão de gravação não é necessária). O acesso de leitura também é suficiente para fazer perguntas sobre as fontes às quais você tem acesso. Para obter mais informações sobre permissões de modelo semântico, consulte Segurança de modelo semântico e conjunto de dados.
  • Se sua organização usar uma capacidade do Power BI Premium por capacidade (P1 ou superior) em vez de um SKU F, verifique se o Microsoft Fabric está habilitado nessa capacidade.
  • Entidades de serviço e tokens de API não são necessários para a experiência de chat no produto. Qualquer automação com entidades de serviço é um cenário separado e não é abordada aqui.

Fluxo de ponta a ponta para criar e consumir agentes de dados do Fabric

Essa seção descreve as principais etapas para criar, validar e compartilhar um agente de dados do Fabric no Fabric, tornando-o acessível para consumo.

O processo é simples e você pode começar a testar os recursos do agente de dados do Fabric em minutos.

Criar um novo agente de dados do Fabric

Para criar um novo agente de dados do Fabric, primeiro navegue até o workspace e selecione o botão + Novo item. Na guia Todos os itens, pesquise Agente de dados do Fabric para localizar a opção apropriada, conforme mostrado nesta captura de tela:

Captura de tela mostrando a criação de um agente de dados do Fabric.

Depois de selecionado, você será solicitado a fornecer um nome para o agente de dados do Fabric, conforme mostrado nesta captura de tela:

Captura de tela mostrando como fornecer o nome para o agente de dados do Fabric.

Veja a captura de tela fornecida para um guia visual sobre como nomear o agente de dados do Fabric. Depois de inserir o nome, prossiga com a configuração para alinhar o agente de dados do Fabric com seus requisitos específicos.

Selecione seus dados

Depois de criar um agente de dados do Fabric, você pode adicionar até cinco fontes de dados - incluindo lakehouses, warehouses, modelos semânticos do Power BI, bancos de dados KQL e ontologias - em qualquer combinação (até cinco no total). Por exemplo, você pode adicionar cinco modelos semânticos do Power BI ou dois modelos semânticos do Power BI, um lakehouse e um banco de dados KQL.

Quando você cria um agente de dados do Fabric pela primeira vez e fornece um nome, o catálogo do OneLake é exibido automaticamente, permitindo que você adicione fontes de dados. Para adicionar uma fonte de dados, selecione-a no catálogo, conforme mostrado na próxima tela e selecione Adicionar. Cada fonte de dados deve ser adicionada individualmente. Por exemplo, você pode adicionar um lakehouse, selecionar Adicionare, em seguida, prosseguir para adicionar outra fonte de dados. Para filtrar os tipos de fonte de dados, selecione o ícone de filtro e, em seguida, selecione o tipo desejado. Você pode exibir apenas as fontes de dados do tipo selecionado, facilitando a localização e a conexão das fontes apropriadas para o agente de dados do Fabric.

Depois de adicionar a fonte de dados, o Explorer no painel esquerdo da página do agente de dados do Fabric é preenchido com as tabelas disponíveis em cada fonte de dados selecionada, onde você pode usar as caixas de seleção para tornar as tabelas disponíveis ou indisponíveis para a IA, conforme mostrado na captura de tela a seguir:

Captura de tela mostrando como adicionar fontes de dados.

Observação

Você só precisa da permissão de Leitura para adicionar um modelo semântico do Power BI como uma fonte de dados. A permissão de gravação não é necessária porque o agente de dados do Fabric emite consultas somente leitura.

Para obter as adições subsequentes de fontes de dados, navegue até o Explorer no painel esquerdo da página do agente de dados do Fabric e selecione + Fonte de dados, conforme mostrado nesta captura de tela:

captura de tela que mostra como adicionar mais fontes de dados.

O catálogo do OneLake é aberto novamente e você pode adicionar diretamente mais fontes de dados conforme necessário.

Dica

Use nomes descritivos para tabelas e colunas. Uma tabela chamada SalesData é mais significativa do que TableAe nomes de coluna como ActiveCustomer ou IsCustomerActive são mais claros do que C1 ou ActCu. Nomes descritivos ajudam a IA a gerar consultas mais precisas e confiáveis.

Faça perguntas

Depois de adicionar as fontes de dados e selecionar as tabelas relevantes para cada fonte de dados, você poderá começar a fazer perguntas. O sistema lida com perguntas conforme mostrado nesta captura de tela:

Captura de tela mostrando uma pergunta para um agente de dados do Fabric.

Perguntas semelhantes a estes exemplos também devem funcionar:

  • "Quais foram nossas vendas totais na Califórnia em 2023?"
  • "Quais são os cinco principais produtos com os preços de lista mais altos e quais são suas categorias?"
  • "Quais são os itens mais caros que nunca foram vendidos?"

Perguntas como essa são adequadas porque o sistema pode traduzi-las em consultas estruturadas (T-SQL, DAX ou KQL), executá-las em bancos de dados e retornar respostas concretas com base em dados armazenados.

No entanto, perguntas como estas estão fora do escopo:

  • "Por que nossa produtividade de fábrica é menor no 2º trimestre de 2024?"
  • "Qual é a causa raiz do nosso pico de vendas?"

No momento, essas perguntas estão fora do escopo porque exigem raciocínio complexo, análise de correlação ou fatores externos não disponíveis diretamente no banco de dados. Atualmente, o agente de dados do Fabric não executa análise avançada, aprendizado de máquina ou inferência causal. Ele simplesmente recupera e processa dados estruturados com base na consulta do usuário.

Quando você faz uma pergunta, o agente de dados do Fabric usa a API do Assistente do OpenAI do Azure para processar a solicitação. O fluxo opera dessa forma:

Acesso ao esquema com credenciais de usuário

O sistema primeiro usa as credenciais do usuário para acessar o esquema da fonte de dados (por exemplo, lakehouse, warehouse, modelo semântico PBI, bancos de dados KQL ou ontologia). Isso garante que o sistema busque informações de estrutura de dados que o usuário tenha permissão para exibir.

Construindo o prompt

Para interpretar a pergunta do usuário, o sistema combina:

  1. Consulta de usuário: a pergunta de linguagem natural fornecida pelo usuário.
  2. Informações de esquema: metadados e detalhes estruturais da fonte de dados recuperada na etapa anterior.
  3. Exemplos e instruções: exemplos predefinidos (por exemplo, perguntas e respostas de exemplo) ou instruções específicas fornecidas ao configurar o agente de dados do Fabric. Esses exemplos e instruções ajudam a refinar a compreensão da IA sobre a questão e orientar como a IA interage com os dados.

Todas essas informações são usadas para construir um prompt. Essa solicitação serve como uma entrada para a API do Assistente do OpenAI do Azure, que se comporta como um agente subjacente ao agente de dados do Fabric. Isso essencialmente instrui o agente de dados do Fabric sobre como processar a consulta e o tipo de resposta a ser produzida.

Invocação de ferramenta com base nas necessidades de consulta

O agente analisa o prompt construído e decide qual ferramenta invocar para recuperar a resposta:

  • Linguagem Natural para SQL (NL2SQL): usado para gerar consultas SQL quando os dados residem em um lakehouse ou warehouse
  • Linguagem Natural para DAX (NL2DAX): usado para criar consultas DAX para interagir com modelos semânticos em fontes de dados do Power BI
  • Linguagem Natural para KQL (NL2KQL): usado para construir consultas KQL para consultar dados em bancos de dados KQL

A ferramenta selecionada gera uma consulta usando o esquema, os metadados e o contexto que o agente subjacente ao agente de dados do Fabric fornece. Em seguida, a ferramenta valida a consulta, para garantir a formatação e a conformidade adequadas com seus protocolos de segurança e suas próprias políticas de IA Responsável (RAI).

Construção de resposta

O agente subjacente ao agente de dados do Fabric executa a consulta e garante que a resposta seja estruturada e formatada adequadamente. O agente geralmente inclui contexto extra para tornar a resposta amigável. Por fim, a resposta é exibida para o usuário em uma interface de conversa, conforme mostrado na seguinte captura de tela:

Captura de tela mostrando a resposta para a pergunta por um agente de dados do Fabric.

O agente apresenta tanto o resultado quanto as etapas intermediárias que foram necessárias para obter a resposta final. Essa abordagem aprimora a transparência e permite a validação dessas etapas, se necessário. Os usuários podem expandir a lista suspensa para as etapas para exibir todas as etapas que o agente de dados do Fabric realizou para recuperar a resposta, conforme mostrado na captura de tela a seguir:

Captura de tela mostrando as etapas executadas por um agente de dados do Fabric.

Além disso, o agente de dados do Fabric fornece o código gerado usado para consultar a fonte de dados correspondente, oferecendo mais informações sobre como a resposta foi construída.

Essas consultas são projetadas exclusivamente para consultar dados. Operações que envolvem a criação de dados, atualizações de dados, exclusões de dados, qualquer tipo de alteração de dados não são permitidas, para proteger a integridade de seus dados.

A qualquer momento, você pode selecionar o botão Limpar chat para limpar o chat, conforme mostrado na seguinte captura de tela:

Captura de tela realçando o recurso Desmarcar chat.

O recurso de chat Clear apaga todo o histórico de chat e inicia uma nova sessão. Depois de excluir o histórico do chat, você não poderá recuperá-lo.

Altere a fonte de dados

Para remover uma fonte de dados, passe o mouse sobre o nome da fonte de dados no Explorer no painel esquerdo da página do agente de dados do Fabric até que o menu de três pontos seja exibido. Selecione os três pontos para revelar as opções e selecione Remover para excluir a fonte de dados, conforme mostrado na captura de tela a seguir:

Captura de tela mostrando como excluir ou atualizar fontes de dados.

Como alternativa, se a fonte de dados for alterada, você poderá selecionar Atualizar no mesmo menu, conforme mostrado na seguinte captura de tela:

Captura de tela mostrando como atualizar uma fonte de dados.

Isso garante que todas as atualizações da fonte de dados sejam refletidas e preenchidas corretamente no Explorer, para manter o agente de dados do Fabric sincronizado com os dados mais recentes.

Configuração do agente de dados do Fabric

O agente de dados do Fabric oferece várias opções de configuração que permitem aos usuários personalizar o comportamento do agente de dados do Fabric, para atender melhor às necessidades da sua organização. À medida que o agente de dados do Fabric processa e apresenta dados, essas configurações oferecem flexibilidade que permite mais controle sobre os resultados.

Fornecer instruções

Você pode fornecer instruções específicas para orientar o comportamento da IA. Para adicioná-las no painel de instruções do agente de dados do Fabric, selecione as Instruções do agente de dados, conforme mostrado na seguinte captura de tela:

Captura de tela mostrando a seleção do botão Instruções do agente de dados.

Aqui, você pode escrever até 15.000 caracteres em texto em inglês sem formatação, para instruir a IA sobre como lidar com consultas.

Por exemplo, você pode especificar a fonte de dados exata a ser usada para determinados tipos de perguntas. Exemplos de opções de fonte de dados podem envolver a orientação da IA a ser usada

  • Modelos semânticos do Power BI para consultas financeiras
  • um lakehouse para dados de vendas
  • um banco de dados KQL para métricas operacionais

Essas instruções garantem que a IA gere consultas apropriadas, seja SQL, DAX ou KQL, com base em suas diretrizes e no contexto das perguntas.

Se o seu recurso de IA interpretar incorretamente certas palavras, siglas ou termos de forma consistente, você poderá tentar fornecer definições claras nesta seção para garantir que a IA os entenda e os processe corretamente. Isso se torna especialmente útil para terminologia específica do domínio ou jargão de negócios exclusivo.

Ao adaptar essas instruções e definir termos, você aprimora a capacidade da IA de fornecer insights precisos e relevantes, em total alinhamento com sua estratégia de dados e requisitos de negócios.

Fornecer consultas de exemplo

Você pode aprimorar a precisão da resposta fornecendo consultas de exemplo personalizadas para cada fonte de dados com suporte (lakehouse, warehouse, banco de dados KQL). Essa abordagem, conhecida como aprendizado de poucas capturas na IA generativa, ajuda a orientar o agente de dados do Fabric a gerar respostas que melhor se alinham às suas expectativas.

Quando você fornece à IA pares de consulta/pergunta de exemplo, ela faz referência a esses exemplos quando responde a perguntas futuras. A correspondência de novas consultas com os exemplos mais relevantes ajuda a IA a incorporar lógica específica aos negócios e responder efetivamente a perguntas frequentes. Essa funcionalidade permite ajuste fino para fontes de dados individuais e garante a geração de consultas SQL ou KQL mais precisas.

Os dados de modelo semântico do Power BI não dão suporte à adição de pares de consulta/pergunta de exemplo no momento. No entanto, para fontes de dados com suporte, como lakehouse, warehouse e bancos de dados KQL, fornecer mais exemplos pode melhorar significativamente a capacidade da IA de gerar consultas precisas quando seu desempenho padrão precisa de ajuste.

Dica

Um conjunto diversificado de consultas de exemplo aprimora a capacidade de um agente de dados do Fabric gerar consultas SQL/KQL precisas e relevantes.

Para adicionar ou editar consultas de exemplo, selecione o botão Exemplo de consultas para abrir o painel de consultas de exemplo, conforme mostrado na captura de tela a seguir:

Captura de tela mostrando onde você pode editar os exemplos que você fornece à IA.

Este painel fornece opções para adicionar ou editar consultas de exemplo para todas as fontes de dados com suporte, exceto modelos semânticos e ontologias do Power BI. Para cada fonte de dados, você pode selecionar Adicionar ou Editar Consultas de Exemplo para inserir os exemplos relevantes, conforme mostrado na seguinte captura de tela:

Captura de tela mostrando os exemplos de SQL que você fornece à IA.

Observação

O agente de dados do Fabric refere-se apenas a consultas que contêm sintaxe SQL/KQL válida e que correspondem ao esquema das tabelas selecionadas. O agente de dados do Fabric não usa consultas que não concluíram sua validação. Verifique se todas as consultas de exemplo são válidas e alinhadas corretamente com o esquema para garantir que o agente de dados do Fabric as utilize efetivamente.

Publicar e compartilhar um agente de dados do Fabric

Depois de testar o desempenho do agente de dados do Fabric em várias perguntas e confirmar que ele gera consultas SQL, DAX ou KQL precisas, você pode compartilhá-lo com seus colegas. Nesse ponto, selecione Publicar, conforme mostrado na seguinte captura de tela:

Captura de tela mostrando a publicação de um agente de dados do Fabric.

Esta etapa abre uma janela que solicita uma descrição do agente de dados do Fabric. Aqui, forneça uma descrição detalhada do que o agente de dados do Fabric faz. Esses detalhes orientam seus colegas sobre a funcionalidade do agente de dados do Fabric e auxiliam outros sistemas/orquestradores de IA a invocar efetivamente o agente de dados do Fabric.

Depois de publicar o agente de dados do Fabric, você terá duas versões dele. Uma das versões é o rascunho atual, que você pode continuar a refinar e melhorar. A segunda versão é a versão publicada, que você pode compartilhar com seus colegas que desejam consultar o agente de dados do Fabric para obter respostas para suas perguntas. Você pode incorporar comentários de seus colegas à sua versão de rascunho atual à medida que a desenvolve, para aprimorar ainda mais o desempenho do agente de dados do Fabric.