Compartilhar via


Conceitos do agente de dados do Fabric (versão prévia)

O agente de dados no Microsoft Fabric é um novo recurso do Microsoft Fabric que permite criar seus próprios sistemas de Q&A de conversa usando IA generativa. Um agente de dados do Fabric torna os insights de dados mais acessíveis e acionáveis para todos em sua organização. Com um agente de dados do Fabric, sua equipe pode ter conversas, com perguntas simples em inglês, sobre os dados que sua organização armazenou no Fabric OneLake e, em seguida, receber respostas relevantes. Dessa forma, mesmo pessoas sem experiência técnica em IA ou uma compreensão profunda da estrutura de dados podem receber respostas precisas e com contexto.

Você também pode adicionar instruções, exemplos e diretrizes específicos da organização para ajustar o agente de dados do Fabric. Isso garante que as respostas se alinhem às necessidades e às metas da sua organização, permitindo que todos se envolvam com os dados de forma mais eficaz. O agente de dados do Fabric promove uma cultura de tomada de decisão controlada por dados porque reduz as barreiras à acessibilidade de insights, facilita a colaboração e ajuda a sua organização a extrair mais valor de seus dados.

Importante

Esse recurso está na versão prévia.

Pré-requisitos

Como funciona o agente de dados do Fabric

O agente de dados do Fabric usa grandes modelos de linguagem (LLMs) para ajudar os usuários a interagir com os seus dados naturalmente. O agente de dados do Fabric aplica APIs do Assistente do OpenAI do Azure e se comporta como um agente. Ele processa perguntas do usuário, determina a fonte de dados mais relevante (Lakehouse, Warehouse, conjunto de dados do Power BI, bancos de dados KQL, ontologia) e invoca a ferramenta apropriada para gerar, validar e executar consultas. Os usuários podem fazer perguntas em linguagem simples e receber respostas estruturadas e legíveis por humanos, eliminando a necessidade de escrever consultas complexas e garantindo acesso preciso e seguro aos dados.

Veja como funciona em detalhes:

Análise de perguntas e validação: o agente de dados do Fabric aplica as APIs do Assistente do Azure OpenAI como o agente subjacente para processar perguntas do usuário. Esta abordagem garante que a questão esteja em conformidade com protocolos de segurança, políticas de IA responsável (RAI) e permissões de usuário. O agente de dados do Fabric impõe estritamente o acesso somente leitura, mantendo conexões de dados somente leitura para todas as fontes de dados.

Identificação da fonte de dados: o agente de dados do Fabric usa as credenciais do usuário para acessar o esquema da fonte de dados. Isso garante que o sistema busque informações de estrutura de dados que o usuário tenha permissão para exibir. Em seguida, ele avalia a pergunta do usuário em relação a todas as fontes de dados disponíveis, incluindo bancos de dados relacionais (Lakehouse e Warehouse), conjuntos de dados do Power BI (Modelos Semânticos), bancos de dados KQL e ontologias. Ele também pode fazer referência às instruções do agente de dados fornecidas pelo usuário para determinar a fonte de dados mais relevante.

Invocação de ferramentas e geração de consultas: depois que a fonte ou fontes corretas são identificadas, o agente de dados do Fabric reformula a questão para aumentar a clareza e estrutura e invoca a ferramenta correspondente para gerar uma consulta estruturada:

  • Linguagem natural para SQL (NL2SQL) para bancos de dados relacionais (lakehouse/warehouse).
  • Linguagem natural para DAX (NL2DAX) para conjuntos de dados do Power BI (modelos semânticos).
  • Linguagem natural para KQL (NL2KQL) para bancos de dados KQL.

A ferramenta selecionada gera uma consulta com base no esquema, nos metadados e no contexto fornecidos que o agente subjacente ao agente de dados do Fabric então passa.

Validação de consulta: a ferramenta executa a validação para garantir que a consulta seja formada corretamente e siga os seus próprios protocolos de segurança e políticas RAI.

Execução de consultas e respostas: depois de validado, o agente de dados do Fabric executa a consulta na fonte de dados escolhida. Os resultados são formatados em uma resposta legível por humanos, que pode incluir dados estruturados, como tabelas, resumos ou insights importantes.

Essa abordagem garante que os usuários possam interagir com os seus dados usando linguagem natural, enquanto o agente de dados do Fabric lida com as complexidades de geração, validação e execução de consultas, tudo sem exigir que os usuários escrevam SQL, DAX ou KQL.

Configuração do agente de dados do Fabric

Configurar um agente de dados do Fabric é semelhante à criação de um relatório do Power BI — você começa projetando e refinando-o para garantir que ele atenda às suas necessidades e, em seguida, você o publica e compartilha com colegas para que eles possam interagir com os dados. A configuração de um agente de dados do Fabric envolve:

Selecionando fontes de dados: um agente de dados do Fabric dá suporte a até cinco fontes de dados em qualquer combinação, incluindo lakehouses, warehouses, bancos de dados KQL, modelos semânticos do Power BI e ontologias. Por exemplo, um agente de dados do Fabric configurado pode incluir cinco modelos semânticos do Power BI. Ele pode incluir uma combinação de dois modelos semânticos do Power BI, um lakehouse e um banco de dados KQL. Você tem muitas opções disponíveis.

Escolher tabelas relevantes: depois de selecionar as fontes de dados, você precisará adicioná-las uma de cada vez e definir as tabelas específicas de cada fonte que serão usadas pelo agente de dados do Fabric. Esta etapa garante que o agente de dados do Fabric recupere resultados precisos concentrando-se apenas em dados relevantes.

Adicionar contexto: para melhorar a precisão do agente de dados do Fabric, você pode fornecer mais contexto por meio de instruções do agente de dados do Fabric e consultas de exemplo. Como o agente subjacente do agente de dados do Fabric, o contexto ajuda a API do Assistente do OpenAI do Azure a tomar decisões mais informadas sobre como processar perguntas do usuário e determinar qual fonte de dados é mais adequada para respondê-las.

  • Instruções do agente de dados: você pode adicionar instruções para orientar o agente que está por trás do agente de dados do Fabric, na determinação da melhor fonte de dados para responder a tipos específicos de perguntas. Você também pode fornecer regras ou definições personalizadas que esclarecem a terminologia organizacional ou requisitos específicos. Essas instruções podem fornecer mais contexto ou preferências que influenciam como o agente seleciona e consulta fontes de dados.

    • Perguntas diretas sobre métricas financeiras para um modelo semântico do Power BI.
    • Atribua consultas que envolvem exploração de dados brutos ao lakehouse.
    • Encaminhe perguntas que exigem análise de log para o banco de dados KQL.
  • Consultas de exemplo: você pode adicionar pares de consulta-pergunta de exemplo para ilustrar como o agente de dados do Fabric deve responder a consultas comuns. Esses exemplos servem como um guia para o agente, que o ajuda a entender como interpretar perguntas semelhantes e gerar respostas precisas.

Observação

No momento, não há suporte para a adição de pares de consulta/pergunta de exemplo para fontes de dados de modelo semântico do Power BI.

Combinando instruções de IA claras e consultas de exemplo relevantes, você pode alinhar melhor o agente de dados do Fabric com as necessidades de dados da sua organização, garantindo respostas mais precisas e com reconhecimento de contexto.

Diferença entre um agente de dados do Fabric e um copiloto

Embora os agentes de dados do Fabric e os co-pilotos do Fabric usem IA generativa para processar e raciocinar dados, há diferenças importantes em suas funcionalidades e casos de uso:

Flexibilidade de configuração: os agentes de dados do Fabric são altamente configuráveis. Você pode fornecer instruções e exemplos personalizados para adaptar o seu comportamento a cenários específicos. Os copilotos do Fabric, por outro lado, são pré-configurados e não oferecem esse nível de personalização.

Escopo e caso de uso: os copilotos do Fabric são projetados para ajudar com tarefas no Microsoft Fabric, como geração de código de notebook ou consultas de warehouse. Os agentes de dados do Fabric, por outro lado, são artefatos autônomos. Para tornar os agentes de dados do Fabric mais versáteis para casos de uso mais amplos, eles podem se integrar a sistemas externos como o Microsoft Copilot Studio, a Fábrica de IA do Azure, o Microsoft Teams ou outras ferramentas fora do Fabric.

Avaliação do agente de dados do Fabric

A qualidade e a segurança das respostas do agente de dados do Fabric passaram por uma avaliação rigorosa:

Teste de comparação: a equipe de produtos testou agentes de dados do Fabric em uma variedade de conjuntos de dados públicos e privados para garantir respostas precisas e de alta qualidade.

Mitigações de danos aprimoradas: há mais proteções em vigor para garantir que as saídas do agente de dados do Fabric permaneçam focadas no contexto de fontes de dados selecionadas, para reduzir o risco de respostas irrelevantes ou enganosas.

Limitações

O agente de dados do Fabric está atualmente em versão prévia pública e tem limitações. As atualizações melhorarão o agente de dados do Fabric ao longo do tempo.

  • O agente de dados do Fabric gera apenas consultas de "leitura" de SQL/DAX/KQL. Ele não gera consultas SQL/DAX/KQL que criam, atualizam ou excluem dados.
  • O Agente de Dados do Fabric não dá suporte a dados não estruturados (.pdf, .docxou .txt). Você não pode usar o agente de dados do Fabric para acessar recursos de dados não estruturados. Esses recursos incluem arquivos .pdf, .docx ou .txt, por exemplo.
  • Atualmente, o agente de dados do Fabric não dá suporte a idiomas que não são em inglês. Para obter um desempenho ideal, forneça perguntas, instruções e consultas de exemplo em inglês.
  • Você não pode alterar o LLM usado pelo agente de dados do Fabric.
  • O histórico de conversas no Agente de Dados do Fabric pode nem sempre persistir. Em determinados casos, como alterações na infraestrutura de back-end, atualizações de serviço ou atualizações de modelo, o histórico da conversa anterior pode ser redefinido ou perdido.