Partilhar via


Criar um agente de dados do Fabric (visualização)

Com um agente de dados no Microsoft Fabric, pode criar experiências conversacionais de IA que respondam a perguntas sobre dados armazenados em lakehouses, armazéns, modelos semânticos Power BI, bases de dados KQL e ontologias no Fabric. Seus colegas podem fazer perguntas em inglês simples e receber respostas baseadas em dados, mesmo que não sejam especialistas em IA ou profundamente familiarizados com os dados.

Importante

Este recurso está em pré-visualização.

Pré-requisitos

Autenticação e tokens

Você não precisa criar ou fornecer uma chave do Azure OpenAI ou um token de acesso para usar um agente de dados do Fabric. O Fabric usa um Assistente OpenAI do Azure gerenciado pela Microsoft e lida com a autenticação para você.

  • O acesso aos dados é executado sob sua identidade de usuário do Microsoft Entra ID e suas permissões de espaço de trabalho/dados. O agente lê esquemas e executa SQL/DAX/KQL somente se você tiver acesso.
  • Para adicionar um modelo semântico do Power BI como fonte de dados, necessita de permissão de leitura nesse modelo (a escrita não é necessária). O acesso de leitura também é suficiente para fazer perguntas sobre fontes que você pode acessar. Para obter mais informações sobre permissões de modelo semântico, consulte Conjunto de dados e segurança de modelo semântico.
  • Se sua organização usa uma capacidade do Power BI Premium por capacidade (P1 ou superior) em vez de uma SKU F, verifique se o Microsoft Fabric está habilitado nessa capacidade.
  • Entidades de serviço e tokens de API não são necessários para a experiência de bate-papo no produto. Qualquer automação com entidades de serviço é um cenário separado e não é abordado aqui.

Fluxo de ponta a ponta para criar e consumir agentes de dados do Fabric

Esta seção descreve as principais etapas para criar, validar e compartilhar um agente de dados no Fabric, para torná-lo disponível para uso.

O processo é simples e você pode começar a testar os recursos do agente de dados do Fabric em minutos.

Criar um novo agente de dados do Fabric

Para criar um novo agente de dados do Fabric, primeiro navegue até o seu espaço de trabalho e selecione o botão + Novo Item. Na guia Todos os itens, procure pelo Agente de Dados do Fabric para localizar a opção apropriada, conforme mostrado nesta captura de ecrã:

Captura de ecrã a mostrar a criação de um agente de dados do Fabric.

Uma vez selecionado, você será solicitado a fornecer um nome para seu agente de dados do Fabric, conforme mostrado nesta captura de tela:

Captura de tela mostrando como fornecer nome para o agente de dados do Fabric.

Consulte a captura de tela fornecida para obter um guia visual sobre como nomear o agente de dados do Fabric. Depois de inserir o nome, prossiga com a configuração para alinhar o agente de dados do Fabric com seus requisitos específicos.

Selecione os seus dados

Depois de criar um agente de dados Fabric, pode adicionar até cinco fontes de dados – incluindo lakehouses, armazéns, modelos semânticos Power BI, bases de dados KQL e ontologias – em qualquer combinação (até cinco no total). Por exemplo, você pode adicionar cinco modelos semânticos do Power BI ou dois modelos semânticos do Power BI, um lakehouse e um banco de dados KQL.

Quando você cria um agente de dados do Fabric pela primeira vez e fornece um nome, o catálogo do OneLake aparece automaticamente, permitindo que você adicione fontes de dados. Para adicionar uma fonte de dados, selecione-a no catálogo, conforme mostrado na próxima tela, e selecione Adicionar. Cada fonte de dados deve ser adicionada individualmente. Por exemplo, pode-se adicionar uma lakehouse, selecionar Adicionar e depois adicionar outra fonte de dados. Para filtrar os tipos de fonte de dados, selecione o ícone de filtro e, em seguida, selecione o tipo desejado. Você pode exibir apenas as fontes de dados do tipo selecionado, facilitando a localização e a conexão das fontes apropriadas para seu agente de dados do Fabric.

Depois de adicionar a fonte de dados, o Explorer no painel à esquerda da página do agente de dados Fabric é preenchido com as tabelas disponíveis em cada fonte de dados selecionada, onde pode usar as caixas de seleção para tornar as tabelas disponíveis ou indisponíveis para a IA, conforme ilustrado na imagem a seguir:

Captura de tela mostrando como adicionar fontes de dados.

Observação

Você só precisa permissão de Ler para adicionar um modelo semântico do Power BI como fonte de dados. A permissão de gravação não é necessária porque o agente de dados do Fabric emite consultas somente leitura.

Para adições subsequentes de fontes de dados, vá ao Explorador no painel esquerdo da página do Agente de dados do Fabric e selecione + Fonte de dados, conforme mostrado nesta captura de ecrã.

Captura de tela que mostra como adicionar mais fontes de dados.

O catálogo do OneLake é aberto novamente e você pode adicionar mais fontes de dados conforme necessário.

Sugestão

Certifique-se de usar nomes descritivos para tabelas e colunas. Uma tabela chamada SalesData é mais significativa do que TableA, e nomes de colunas como ActiveCustomer ou IsCustomerActive são mais claros do que C1 ou ActCu. Nomes descritivos ajudam a IA a gerar consultas mais precisas e confiáveis.

Faça perguntas

Depois de adicionar as fontes de dados e selecionar as tabelas relevantes para cada fonte de dados, você pode começar a fazer perguntas. O sistema lida com perguntas como mostrado nesta captura de tela:

Captura de tela mostrando uma pergunta para um agente de dados do Fabric.

Perguntas semelhantes a estes exemplos também devem funcionar:

  • "Quais foram nossas vendas totais na Califórnia em 2023?"
  • "Quais são os 5 principais produtos com os preços de tabela mais altos e quais são suas categorias?"
  • "Quais são os itens mais caros que nunca foram vendidos?"

Perguntas como esta são adequadas porque o sistema pode traduzi-las em consultas estruturadas (T-SQL, DAX ou KQL), executá-las em bancos de dados e, em seguida, retornar respostas concretas com base em dados armazenados.

No entanto, perguntas como essas estão fora do escopo:

  • "Porque é que a nossa produtividade fabril é mais baixa no segundo trimestre de 2024?"
  • "Qual é a causa raiz do nosso pico de vendas?"

Essas perguntas estão atualmente fora do escopo porque exigem raciocínio complexo, análise de correlação ou fatores externos não disponíveis diretamente no banco de dados. Atualmente, o agente de dados do Fabric não executa análises avançadas, aprendizado de máquina ou inferência causal. Ele simplesmente recupera e processa dados estruturados com base na consulta do usuário.

Quando você faz uma pergunta, o agente de dados do Fabric usa a API do Assistente OpenAI do Azure para processar a solicitação. O fluxo funciona desta forma:

Acesso ao esquema com credenciais de usuário

O sistema utiliza primeiro as credenciais do utilizador para aceder ao esquema da fonte de dados (por exemplo, lakehouse, armazém, modelo semântico PBI, bases de dados KQL ou ontologia). Isso garante que o sistema busque informações de estrutura de dados que o usuário tem permissão para visualizar.

Construindo o prompt

Para interpretar a pergunta do utilizador, o sistema combina:

  1. Consulta do usuário: A pergunta de linguagem natural fornecida pelo usuário.
  2. Informações do esquema: metadados e detalhes estruturais da fonte de dados recuperados na etapa anterior.
  3. Exemplos e instruções: quaisquer exemplos predefinidos (por exemplo, exemplos de perguntas e respostas) ou instruções específicas fornecidas ao configurar o agente de dados do Fabric. Esses exemplos e instruções ajudam a refinar a compreensão da IA sobre a questão e orientam como a IA interage com os dados.

Todas essas informações são usadas para construir um prompt. Esse prompt serve como uma entrada para a API do Assistente OpenAI do Azure, que se comporta como um agente subjacente ao agente de dados do Fabric. Isso essencialmente instrui o agente de dados do Fabric sobre como processar a consulta e o tipo de resposta a ser produzida.

Invocação de ferramenta com base nas necessidades de consulta

O agente analisa o prompt construído e decide qual ferramenta invocar para recuperar a resposta:

  • Natural Language to SQL (NL2SQL): Usado para gerar consultas SQL quando os dados residem em um lago ou armazém
  • Natural Language to DAX (NL2DAX): usado para criar consultas DAX para interagir com modelos semânticos em fontes de dados do Power BI
  • Natural Language to KQL (NL2KQL): Usado para construir consultas KQL para consultar dados em bancos de dados KQL

A ferramenta selecionada gera uma consulta usando o esquema, os metadados e o contexto que o agente subjacente ao agente de dados de malha fornece. Em seguida, a ferramenta valida a consulta, para garantir a formatação adequada e a conformidade com seus protocolos de segurança e suas próprias políticas de IA Responsável (RAI).

Construção da resposta

O agente subjacente ao agente de dados Fabric executa a consulta e garante que a resposta seja estruturada e formatada adequadamente. O agente geralmente inclui contexto extra para tornar a resposta fácil de usar. Finalmente, a resposta é exibida para o usuário em uma interface de conversação, como mostrado na captura de tela a seguir:

Captura de ecrã mostrando a resposta à pergunta de um agente de dados da Fabric.

O agente apresenta o resultado e as etapas intermediárias que tomou para recuperar a resposta final. Esta abordagem aumenta a transparência e permite validar essas etapas, se necessário. Os usuários podem expandir a lista suspensa para as etapas para exibir todas as etapas que o agente de dados do Fabric executou para recuperar a resposta, conforme mostrado na captura de tela a seguir:

Captura de ecrã mostrando as etapas realizadas por um agente de dados da Fabric.

Além disso, o agente de dados Fabric fornece o código gerado usado para consultar a fonte de dados correspondente, oferecendo mais informações sobre como a resposta foi construída.

Essas consultas são projetadas exclusivamente para consultar dados. Operações que envolvam criação de dados, atualizações de dados, exclusões de dados, qualquer tipo de alteração de dados não são permitidas, para proteger a integridade de seus dados.

A qualquer momento, pode selecionar o botão Limpar bate-papo para limpar o bate-papo, como mostrado na captura de ecrã abaixo:

Captura de tela destacando o recurso Limpar bate-papo.

O recurso Limpar bate-papo apaga todo o histórico de bate-papo e inicia uma nova sessão. Depois de excluir seu histórico de bate-papo, você não poderá recuperá-lo.

Alterar a fonte de dados

Para remover uma fonte de dados, passe o cursor sobre o nome da fonte de dados no Explorer no painel esquerdo da página do agente de dados do Fabric até que o menu de três pontos apareça. Selecione os três pontos para revelar as opções e, em seguida, selecione Remover para excluir a fonte de dados, conforme mostrado na captura de tela a seguir:

Captura de tela mostrando como excluir ou atualizar fontes de dados.

Como alternativa, se a fonte de dados for alterada, você poderá selecionar Atualizar no mesmo menu, conforme mostrado na captura de tela a seguir:

Captura de tela mostrando como atualizar uma fonte de dados.

Isso garante que todas as atualizações da fonte de dados sejam refletidas e preenchidas corretamente no Explorer, para manter seu agente de dados do Fabric sincronizado com os dados mais recentes.

Configuração do agente de dados do tecido

O agente de dados de malha oferece várias opções de configuração que permitem que os usuários personalizem o comportamento do agente de dados de malha, para melhor atender às necessidades de sua organização. À medida que o agente de dados do Fabric processa e apresenta dados, essas configurações oferecem flexibilidade que permite mais controle sobre os resultados.

Fornecer instruções

Você pode fornecer instruções específicas para orientar o comportamento da IA. Para adicioná-los no painel de instruções do agente de dados do Fabric, selecione Instruções do agente de dados, conforme mostrado na captura de tela a seguir.

Captura de tela mostrando a seleção do botão Instruções do agente de dados.

Aqui, você pode escrever até 15.000 caracteres em texto simples em inglês, para instruir a IA sobre como lidar com consultas.

Por exemplo, você pode especificar a fonte de dados exata a ser usada para certos tipos de perguntas. Exemplos de escolhas de fontes de dados podem envolver direcionar a IA para uso

  • Modelos semânticos do Power BI para consultas financeiras
  • Uma “Lakehouse” para dados de vendas
  • um banco de dados KQL para métricas operacionais

Essas instruções garantem que a IA gere consultas apropriadas, seja SQL, DAX ou KQL, com base em sua orientação e no contexto das perguntas.

Se o seu recurso de IA interpreta consistentemente mal certas palavras, acrónimos ou termos, pode tentar fornecer definições claras nesta secção, para garantir que a IA os compreende e processa corretamente. Isso se torna especialmente útil para terminologia específica de domínio ou jargão comercial exclusivo.

Ao adaptar essas instruções e definir termos, você aprimora a capacidade da IA de fornecer insights precisos e relevantes, em total alinhamento com sua estratégia de dados e requisitos de negócios.

Fornecer consultas de exemplo

Você pode melhorar a precisão da resposta fornecendo consultas de exemplo personalizadas para cada fonte de dados suportada (lakehouse, armazém, banco de dados KQL). Essa abordagem, conhecida como aprendizagem de poucas tiragens em IA generativa, ajuda a orientar o agente de dados do Fabric a gerar respostas que se alinham melhor com suas expectativas.

Quando você fornece à IA exemplos de pares de consulta/pergunta, ela faz referência a esses exemplos quando responde a perguntas futuras. A correspondência de novas consultas com os exemplos mais relevantes ajuda a IA a incorporar lógica específica do negócio e responder de forma eficaz às perguntas mais frequentes. Essa funcionalidade permite o ajuste fino para fontes de dados individuais e garante a geração de consultas SQL ou KQL mais precisas.

Os dados do modelo semântico do Power BI não suportam a adição de pares de consulta/pergunta de exemplo neste momento. No entanto, para fontes de dados suportadas, como bancos de dados lakehouse, warehouse e KQL, fornecer mais exemplos pode melhorar significativamente a capacidade da IA de gerar consultas precisas quando seu desempenho padrão precisa de ajustes.

Sugestão

Um conjunto diversificado de consultas de exemplo melhora a capacidade de um agente de dados de malha gerar consultas SQL/KQL precisas e relevantes.

Para adicionar ou editar consultas de exemplo, selecione o botão Consultas de exemplo para abrir o painel de consultas de exemplo, conforme mostrado na captura de tela a seguir:

Captura de tela mostrando onde você pode editar os exemplos fornecidos à IA.

Este painel fornece opções para adicionar ou editar consultas de exemplo para todas as fontes de dados suportadas, exceto modelos semânticos e ontologias do Power BI. Para cada fonte de dados, você pode selecionar Adicionar ou Editar Consultas de Exemplo para inserir os exemplos relevantes, conforme mostrado na captura de tela a seguir:

Captura de tela mostrando os exemplos de SQL que você fornece à IA.

Observação

O agente de dados Fabric refere-se apenas a consultas que contêm sintaxe SQL/KQL válida e que correspondem ao esquema das tabelas selecionadas. O agente de dados do Fabric não usa consultas que não tenham concluído sua validação. Certifique-se de que todas as consultas de exemplo sejam válidas e alinhadas corretamente com o esquema para garantir que o agente de dados do Fabric as utilize de forma eficaz.

Publicar e compartilhar um agente de dados do Fabric

Depois de testar o desempenho do agente de dados do Fabric em várias perguntas e confirmar que ele gera consultas SQL, DAX ou KQL precisas, você pode compartilhá-lo com seus colegas. Nesse ponto, selecione Publicar, conforme mostrado na captura de tela a seguir:

Captura de tela mostrando a publicação de um agente de dados do Fabric.

Esta etapa abre uma janela que solicita uma descrição do agente de dados do Fabric. Aqui, forneça uma descrição detalhada do que o agente de dados do Fabric faz. Esses detalhes orientam seus colegas sobre a funcionalidade do agente de dados do Fabric e ajudam outros sistemas/orquestradores de IA a invocar efetivamente o agente de dados do Fabric.

Depois de publicar o agente de dados do Fabric, você terá duas versões dele. Uma das versões é o rascunho atual, que pode continuar a refinar e melhorar. A segunda versão é a versão publicada, que você pode compartilhar com seus colegas que desejam consultar o agente de dados do Fabric para obter respostas às suas perguntas. Você pode incorporar o feedback de seus colegas em sua versão de rascunho atual à medida que a desenvolve, para melhorar ainda mais o desempenho do agente de dados do Fabric.