Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A governação de dados do Microsoft Purview, com Catálogo unificado do Microsoft Purview e Mapa de Dados do Microsoft Purview, proporciona visibilidade abrangente, confiança nos dados e inovação responsável para ajudar as organizações a alcançar um maior valor comercial na era da IA. Com um exemplo de gestão de dados de estado de funcionamento, siga os passos neste artigo para o ajudar a compreender como configurar Catálogo unificado e utilizar a respetiva funcionalidade para criar uma boa prática de governação de dados para a sua organização.
Passo 1: Configurar os domínios de governação no Catálogo unificado
Os domínios de governação são a chave para estabelecer responsabilidade pelos seus dados e ajudar a federar a governação desses dados em toda a empresa. Quando criar domínios de governação, comece com o proprietário adequado para garantir que consegue identificar e colaborar eficazmente com especialistas para todos os dados no património de dados. Os domínios de governação podem ser muitos tipos diferentes para alinhar com o tipo de limite de dados para a equipa que governa esses dados. Por exemplo: domínios funcionais (finanças, RH, vendas) ou domínios de dados (produto, cliente, estado de funcionamento).
Pré-requisitos
Conceder permissões e criar o primeiro domínio de governação
Abra o portal do Microsoft Purview.
Inicie sessão no portal do Microsoft Purview com as credenciais de uma conta de administrador que tenha a função de Gestão de funções (por exemplo, um administrador do Purview). Aceda a Definições > Funções e âmbitos para ver e gerir.
Selecione Grupos de funções.
Na página Grupos de funções para soluções do Microsoft Purview , selecione o grupo de funções Governação de Dados .
Na página Editar membro do grupo de funções, selecione Escolher utilizadores ou Escolher grupos.
Selecione a caixa de marcar para todos os utilizadores ou grupos que pretende adicionar ao grupo de funções.
Selecione Selecionar.
Em Catálogo unificado, selecione Gestão do catálogo e, em seguida, domínios de governação.
Na página Domínios de governação , pode configurar o resto do catálogo para permitir que outras pessoas federam a propriedade dos dados, capacitem as equipas para desenvolverem os seus conhecimentos e estabelecerem o valor comercial dos seus dados.
- Comece por selecionar Novo domínio de governação.
- Pode atualizar o nome do seu domínio de governação. Neste tutorial, dê-lhe o nome "(Tutorial) Saúde Pessoal" e dê-lhe uma descrição de "Os dados de saúde pessoal referem-se a quaisquer informações relacionadas com a saúde física ou mental de uma pessoa que é recolhida e utilizada no setor da saúde. Estes dados podem incluir uma vasta gama de tipos, como registos médicos, históricos de tratamento, imagens de diagnóstico e resultados de testes laboratoriais. É muitas vezes protegido ao abrigo de várias leis e regulamentos para garantir privacidade e confidencialidade."
- Selecione o tipo como um "domínio de dados".
- Deixe o elemento principal em branco (se este for o primeiro domínio de governação no catálogo, não tem um principal).
- Selecione Criar.
- Agora, crie mais dois domínios sozinho. Estes domínios são pontos-chave de federação para colaboração e governação na sua organização. Pense em quem poderá ser o proprietário dos seus domínios quando implementar Catálogo unificado.
- Pode seguir estes exemplos:
- Um domínio funcional empresarial representa os recursos e termos altamente controlados que uma empresa inteira utiliza. - Sales é um domínio funcional que a maioria das organizações tem como um domínio subordinado da empresa.
- Comece por selecionar Novo domínio de governação.
Selecione o domínio de governação que criou.
Selecione o separador Funções do domínio de governação.
Por predefinição, quando cria o domínio de governação, é adicionado a todas as funções no domínio de governação. Enquanto proprietário de um domínio de governação, adiciona os responsáveis pelos dados (especialistas empresariais no seu domínio) e os proprietários dos produtos de dados (que sabem quais os recursos de dados mais adequados para outros utilizadores consumirem).
Regresse ao separador Detalhes .
Selecione Gerir políticas para aplicar uma política ao nível do domínio. Esta política aplica-se a todos os produtos de dados no domínio. Ao ativar a aplicação automática de uma política, os especialistas em dados também não têm de ser especialistas em políticas.
No separador Gerir políticas de acesso , selecione a caixa de verificação junto a Permitir cópias de dados. Ao selecionar esta opção de política, aplica automaticamente um atestado que requer que todos os utilizadores que pedem acesso aos seus produtos de dados atestam que compreendem a política de cópia de dados dos seus dados.
Selecione Guardar alterações para confirmar que a política está definida pelo domínio de governação.
Selecione Publicar no domínio de governação, que publica todos os outros conceitos no domínio.
Criar termos do glossário
Adicionar termos do glossário ao seu domínio de governação ajuda outras pessoas a compreender como a empresa utiliza e interpreta os dados. Os termos do glossário também garantem que as informações utilizam termos comuns e, geralmente, os seus conhecimentos em todo o seu domínio de governação.
Na página do seu domínio de governação, localize os termos do Glossário card e selecione Ver tudo.
Na página Termos do glossário , selecione Novo termo.
Introduza os detalhes: 1. Nome: "Surto".
- Descrição: uma doença que afeta ou tem o potencial de afetar uma grande parte da população.
- Por agora, pode deixar o resto em branco, mas existem campos a recolher: o proprietário do termo responsável por definir o termo para a sua empresa, acrónimos para partilhar também comuns, também conhecidos como nomes do termo, por último, pode fornecer ligações para os recursos que teriam ainda mais informações sobre o termo.
Selecione Criar.
Selecione Gerir Políticas. Semelhante às políticas ao nível do domínio, pode criar políticas de nível de termos que se aplicam onde quer que o termo esteja a ser utilizado.
Selecione a caixa junto a Aprovação do gestor necessária. Esta política impõe uma aprovação secundária do gestor do utilizador no Microsoft Entra ID quando é pedido acesso aos produtos de dados.
Selecione Publicar para o termo Surto criado. Os termos publicados são filtráveis no Catálogo unificado e garantem que outras pessoas que utilizam o termo para descrever o respetivo produto de dados podem ver essa descrição no Catálogo unificado enquanto navegam no produto de dados.
Agora, crie mais dois termos. Desta vez, selecione o termo "Surto" como o termo principal para os termos que criou. Experimente criar relações entre estes termos subordinados no separador relacionado em qualquer um dos termos para ajudar a criar a rede de como estes termos funcionam em conjunto para explicar a totalidade de um tópico.
- Pandemia: Um surto global de uma doença que afeta um grande número de pessoas em vários países/regiões ou continentes.
- Epidemia: Um surto nacional ou regional de uma doença altamente contagiosa e afeta uma grande parte da população.
Experimente criar alguns outros termos em quaisquer outros domínios que tenha criado anteriormente. Se não tiver a certeza do que adicionar, selecione Obter termos sugeridos para que a IA geradora proponha alguns com base na descrição e no nome do domínio que já forneceu.
Adicionar um OKR
Adicione um OKR (objetivo e resultado chave) para o seu domínio de Saúde Pessoal para ajudar outras pessoas a compreender o valor comercial dos seus dados. Este passo cria uma ligação direta entre os seus dados e o valor comercial que fornece.
Selecione a caixa OKR na página do domínio de governação.
Selecione Novo OKR.
Introduza primeiro os detalhes do objetivo:
- Objetivo: reduza o risco de pandemia ao permitir a aceitação eficaz da vacina contra o paciente.
- Proprietário: introduza o seu nome
- Data de destino: "2024-12-31"
Selecione Criar.
Adicione resultados importantes ao seu objetivo para tornar os objetivos mensuráveis e para monitorizar o progresso em direção ao objetivo. Selecione Adicionar resultado da chave.
Introduza os Detalhes do resultado da chave:
- Resultado principal: certifique-se de que 80% das faixas etárias mais velhas (>65 anos) que são mais prováveis de serem afetadas pela pandemia recebem vacinação total até ao final do ano civil de 2024.
- Progresso status: No caminho certo
- Montante do Progresso: 70
- Valor do objetivo: 80
- Montante máximo: 100
Selecione Criar.
Selecionar Publicar.
Criar elementos de dados críticos
Crie um elemento de dados crítico (CDE) no Estado de Funcionamento Pessoal para garantir que as colunas de dados mais importantes têm uma definição e compreensão consistentes. A CDE cumpre sempre as expectativas empresariais relativamente à forma como esses dados são formados e armazenados.
- Na página domínios de governação com o domínio Estado de Funcionamento Pessoal selecionado, selecione a caixa Elementos de dados críticos .
- Selecione Novo elemento de dados críticos.
- Introduza os metadados básicos do CDE:
- Nome: Grupos etários
- Descrição: o agrupamento comum de idades de pessoas utilizado para garantir que os relatórios analíticos necessários seguem uma referência de que outras pessoas podem depender e remover idades individuais para melhorar o anonimato dos dados. A faixa etária está dividida em oito grupos: <2 anos, 2-4 anos, 5-11 anos, 12-17 anos, 18-24 anos, 25-49 anos, 50-64 anos, mais de 65 anos.
- Proprietário: introduza o seu nome
- Tipo de Dados Esperado: Texto
- Selecione Criar.
O poder real do CDE é que mapeia diretamente para as colunas de dados físicos onde estes dados são armazenados. Esta ligação garante uma compreensão comum e permite a avaliação de regras e políticas de Qualidade de Dados em escala.
No CDE que acabou de criar, selecione Adicionar coluna.
Procure o recurso de dados Covid 19 Vaccine and Case Trends do contentor dourado do data lake
Selecione a caixa, não o nome, do recurso Covid 19 Vaccine and Case Trends .
Dica
Se selecionar o nome azul do elemento, este abre uma nova janela que mostra os detalhes do recurso.
Selecione o botão de opção junto à coluna AgeGroupVacc.
Selecione Adicionar.
Selecione o separador Qualidade dos dados na parte superior da CDE que acabou de criar para aplicar regras de qualidade de dados à CDE. É semelhante à forma como adicionou políticas para termos do glossário e domínios de governação.
Selecionar Nova regra
Selecionar Correspondência de tipo de dados
Introduzir Nome da regra: Confirmar formatação do grupo Etário
Selecione Criar.
Selecione Publicar no CDE
Agora, este CDE aplica automaticamente uma regra de qualidade de dados a todos os produtos de dados que utilizem o recurso Covid 19 Vaccine and Case Trends, que verá na secção seguinte.
- Experimente criar alguns outros CDEs nos seus outros domínios. Eis algumas ideias:
- Vendas: Receita e Nome do Vendedor
- Empresa: ID do Produto
Passo 2: Configurar e registar os seus dados no Mapa de Dados
Se não tiver origens de dados disponíveis para análise, siga estes passos para implementar totalmente um exemplo de Azure Data Lake Storage (ADLS Gen2).
Dica
Se já tiver uma origem de dados no mesmo inquilino que a sua conta do Microsoft Purview, avance para a próxima parte desta secção para analisar os seus recursos.
Num imobiliário de dados, encontra muitos sistemas diferentes em utilização para diferentes aplicações de dados. Existem ambientes de relatórios como Recursos de Infraestrutura e Snowflake onde as equipas utilizam cópias de dados para criar soluções analíticas e alimentar os seus relatórios e dashboards. Existem sistemas de dados operacionais que alimentam as equipas ou os clientes das aplicações para concluir processos empresariais que recolhem ou adicionam dados com base nas decisões tomadas durante o processo.
Para criar um património de dados mais realista, mostre muitas origens de dados no catálogo, que podem abranger a amplitude de diferentes utilizações de dados que qualquer empresa pode ter. Os tipos de dados necessários para alimentar um caso de utilização podem ser muito diferentes com os utilizadores empresariais que precisam de relatórios e dashboards, os analistas precisam de dimensões e factos em conformidade para criar relatórios, cientistas de dados ou engenheiros de dados precisam de dados de origem não processados provenientes diretamente do sistema que recolhe os dados. Tudo isto e muito mais permitem que diferentes utilizadores vejam a importância de encontrar, compreender e aceder a dados no mesmo local.
Para outros tutoriais para adicionar dados à sua propriedade, siga estes guias:
- Tutorial do Fabric Lakehouse – fornece a base de um ambiente de relatórios
- base de dados do SQL do Azure (Exemplo) – fornece um exemplo bem estruturado de um arquivo de dados operacional
Pré-requisitos
- Subscrição no Azure: Criar a Sua Conta Gratuita do Azure Hoje
- Microsoft Entra ID do seu inquilino: Microsoft Entra ID Governance
- Uma conta do Microsoft Purview e privilégios de administrador (esta é a predefinição se tiver criado a conta do Microsoft Purview).
- Todos os recursos; O Microsoft Purview, a sua origem de dados e Microsoft Entra ID têm de estar no mesmo inquilino da cloud.
Configurar o seu património de dados
A. Criar e preencher uma conta de armazenamento
- Siga este guia para criar uma conta de armazenamento: Criar uma conta de armazenamento para Azure Data Lake Storage Gen2
- Crie contentores para o seu novo data lake:
- Aceda à página Descrição geral da sua Conta de Armazenamento.
- Selecione o separador Contentores na secção Armazenamento de dados.
- Selecione Contentor.
- Atribua o nome "bronze" ao contentor e selecione Criar.
- Repita estes passos para criar um contentor "gold".
- Transfira alguns dados CSV de exemplo do data.gov: Vacinação Covid-19 E Tendências de Casos por Grupo Etário, Estados Unidos
- Carregue o CSV para o contentor com o nome "bronze" na conta de armazenamento que criou.
- Selecione o contentor com o nome "bronze" e selecione Carregar.
- Procure a localização onde guardou o CSV e selecione o ficheiro covid-19_Vaccination_Case _Trends .
- Selecione Carregar.
B. Criar um Azure Data Factory
Este passo demonstra como os dados se movem entre camadas de um data lake de medalhão e garante que os dados estão num formato padronizado que os consumidores esperam utilizar. Este passo é um pré-requisito para executar a qualidade dos dados.
Siga este guia para criar um Azure Data Factory: Criar um Azure Data Factory
Copie os dados do CSV no contentor "bronze" para o contentor "gold" como uma tabela de formato Delta com este guia de Azure Data Factory: Transformar dados com um fluxo de dados de mapeamento
Abra a experiência do Azure Data Factory (ADF) a partir do portal do Azure ao selecionar Iniciar estúdio no separador Descrição geral do recurso do ADF criado.
Selecione o separador Autor no estúdio do ADF.
Selecione o + comando e, em seguida, selecione Fluxo de dados.
Atribua o nome "CSVtoDeltaC19VaxTrends" ao fluxo de dados.
Selecione Adicionar Origem na caixa vazia.
Defina Definições de origem como:
- Nome do fluxo de saída: "C19csv"
- Descrição: deixe em branco
- Tipo de origem: Inline
- Tipo de conjunto de dados inline: Texto Delimitado
- Serviço Ligado: selecione o data lake onde armazenou o csv
Defina opções de Origem como:
- Modo de ficheiro: Ficheiro
- Caminho do ficheiro: /bronze/ Covid-19_Vaccination_Case _Trends
- Não permitir ficheiros encontrados: deixe desmarcado
- Captura de dados alterados: deixar desmarcada
- Tipo de compressão: Nenhum
- Codificação: Predefinição(UTF-8)
- Delimitador de colunas: Vírgula (,)
- Delimitador de linhas: Predefinição(\r, \n ou\r\n)
- Caráter de aspas: aspas duplas (")
- Caráter de escape: Barra invertida ()
- Primeira linha como cabeçalho: SELECIONADO
- Deixe o resto como predefinições
Selecione Seguinte pela origem criada e selecione Sink.
Crie o sink onde o formato e a localização dos dados a armazenar para mover os dados de um csv em "bronze" para uma tabela delta em "gold".
- Defina os valores sink (deixe todas as definições como predefinição, a menos que seja especificado).
- Tipo de sink: Inline.
- Tipo de conjunto de dados inline: Delta.
- Serviço ligado: o mesmo data lake utilizado na origem, porque está a armazenar num contentor diferente.
Defina os Valores de definição (deixe todas as definições como predefinição, a menos que seja especificado)
- Caminho da pasta: gold/Covid19 Vaccine and Case Trends.
Introduza o valor porque este nome é como pretende armazenar os dados e não existe para selecionar.
Selecione Validar. Esta ação verifica o fluxo de dados e fornece instruções para corrigir erros.
Selecione Publicar tudo.
Selecione o + comando e, em seguida, selecione Pipeline.
Atribua o nome "CSV ao Delta C19 Vax Trends" ao pipeline.
Selecione o fluxo de dados criado nos passos anteriores CSV para Delta (C19VaxTrends) e arraste e largue-o no separador de pipeline aberto.
Selecione Validar.
Selecionar Publicar.
Selecione Depurar (utilizar o runtime de atividade) para executar o pipeline.
Dica
Se receber erros de espaços ou carateres inadequados para o formato delta, abra o CSV transferido e faça correções. Em seguida, volte a carregar e substitua o CSV na zona de bronze. Em seguida, volte a executar o pipeline.
Navegue para o contentor gold no data lake e deverá agora ver a nova tabela Delta criada durante o pipeline.
Analisar os recursos
Se ainda não analisou recursos de dados no mapa de dados, siga estes passos para preencher o mapa de dados.
A análise de origens no seu património de dados recolhe automaticamente os metadados dos recursos de dados (tabelas, ficheiros, pastas, relatórios e muito mais) nessas origens. Quando regista uma origem de dados e cria a análise, estabelece a propriedade técnica sobre as origens e recursos que aparecem no catálogo. Também pode controlar quem pode aceder a que metadados no Microsoft Purview. Quando regista e armazena origens e recursos ao nível do domínio, armazena-os no nível mais elevado da hierarquia de acesso. Normalmente, é melhor criar algumas coleções onde analisa os metadados do recurso e estabelece a hierarquia de acesso correta para esses dados.
-
Forneça acesso de leitor para a Identidade Gerida (MSI) do Microsoft Purview ao data lake ou a outro arquivo de dados.
Dica
O MSI é o nome da conta da instância do Microsoft Purview.
Se optar por utilizar Recursos de Infraestrutura ou SQL, utilize estes guias para fornecer acesso:
Registar o data lake e analisar os seus recursos
No Mapa de Dados, no separador domínios, selecione as Atribuições de funções do domínio (é o nome da conta do Microsoft Purview):
- Adicione-se como administrador da origem de dados e curador de dados ao domínio.
- Selecione o ícone de pessoa junto à função Administrador da origem de dados. 1. Pesquise o seu nome tal como está no Microsoft Entra ID (poderá ter de introduzir o seu nome completo escrito exatamente como está no Microsoft Entra ID).
- Selecione OK.
- Repita estes passos para o curador de dados.
- Adicione-se como administrador da origem de dados e curador de dados ao domínio.
Registar o data lake:
- Selecione a guia Fontes de dados.
- Selecione Registrar.
- Selecione o tipo de armazenamento Azure Data Lake Storage Gen2.
Indique os detalhes para ligar:
- Subscrição (opcional)
- Nome da Origem de Dados (este é o nome da origem do ADLS Gen2)
- Coleção onde os metadados de recursos devem ser armazenados (opcional)
- Selecione Registar
Assim que o registo da origem de dados estiver concluído, pode configurar a análise. O registo significa que o Microsoft Purview está ligado à origem de dados e colocou-o na coleção correta para propriedade. A análise lê os metadados da origem e preenche os recursos no mapa de dados.
Selecione a origem que registou no separador origens de dados
Selecione nova análise e forneça os detalhes:
- Utilizar o runtime de integração predefinido para esta análise
- A credencial deve ser MICROSOFT Purview MSI (sistema)
- O nível de análise é Deteção Automática
- Selecione uma coleção ou utilize o domínio (a coleção tem de ser a mesma coleção ou coleção subordinada do local onde a origem de dados foi registada)
- Selecione Continuar
Dica
Neste momento, a ligação é testada para validar a execução de uma análise. Se não conceder acesso ao leitor MSI do Microsoft Purview na origem de dados, esta falha. Se não for o proprietário da origem de dados ou não tiver acesso de utilizador contribuidor, a análise falhará, uma vez que espera que tenha autorização para criar a ligação.
Agora, selecione apenas o contentor "gold" onde colocou a tabela delta na secção building data do tutorial. Esta seleção impede a análise de quaisquer outros recursos de dados que estejam no arquivo de dados.
- Se tiver apenas um marcar azul junto a ouro, pode deixar verificações junto a tudo, uma vez que analisará a origem completa e ainda criará os recursos que iremos utilizar e muito mais.
- Selecione Continuar
No ecrã selecionar um conjunto de regras de análise, deve utilizar o conjunto de regras de análise predefinido.
Selecione Continuar
Ao definir um acionador de análise, irá definir a frequência da análise para que, à medida que continuar a adicionar recursos de dados ao contentor dourado do lago, continue a preencher o mapa de dados. Selecione Uma Vez.
Selecione Continuar.
Selecione Guardar e Executar. Esta ação cria uma análise que lê os metadados do contentor dourado do data lake e preenche a tabela que iremos utilizar no Catálogo unificado nas secções seguintes. Se selecionar guardar apenas, este não executa a análise e não vê os recursos. Assim que a análise estiver em execução, verá a análise que criou com uma Última execução status de Colocação em Fila. Quando a leitura da análise estiver concluída, os recursos estão prontos para a secção seguinte. Este processo pode demorar alguns minutos ou horas consoante o número de recursos que tem na sua origem.
Passo 3: publicar os seus produtos de dados
A criação de produtos de dados é essencial para garantir que a sua organização consegue descobrir os dados certos. Os produtos de dados ajudam a impedir dados de administração excessiva que têm valor baixo ou nenhum no seu património de dados, uma vez que não têm qualquer utilização ou valor limitado. Quando os seus especialistas em dados publicam produtos de dados, ativa os seus dados mais valiosos e cria o nível certo de governação com base nesse valor. A curadoria de ativos de que as equipas técnicas não conhecem o objetivo comercial ou que tentam governar tudo no seu complexo e crescente património de dados, causa tempo extra e perda de produtividade perseguindo os detalhes dos dados que podem nunca ser utilizados ou que podem simplesmente ser removidos do património. Em vez disso, concentre-se nas partes de dados que têm valor e que as pessoas precisam de descobrir e construir ainda mais valor. À medida que as equipas utilizam mais dados e compreendem melhor o que é necessário, pode criar produtos de dados mais úteis para satisfazer essas exigências. A governação pode adaptar-se para garantir que mantém sempre o tamanho certo com base no valor e sensibilidade dos dados.
Pré-requisitos
- Seja proprietário de um produto de dados para o domínio de governação que está a utilizar.
- Ter recursos de dados no Mapa de Dados. Se não o fizer, consulte a secção 2 deste tutorial para adicionar alguns.
- Publicar um domínio de governação para publicar um produto de dados. Se não tiver um, consulte a secção 1 deste tutorial para criar um.
Criar e publicar um produto de dados
Abra o portal do Microsoft Purview.
Selecione Catálogo unificado.
Selecione Gestão do catálogo e , em seguida, Domínios de governação.
Na página Domínios de governação , selecione o domínio Estado de Funcionamento Pessoal.
Selecione Ir para produtos de dados em Conceitos empresariais.
Eis onde os especialistas em dados denominados proprietários de produtos de dados identificarão os recursos de dados que se destinam a ser consumidos por outras pessoas na sua organização e fornecerão as informações necessárias para os tornar utilizáveis.
Selecione Novo produto de dados.
Forneça detalhes sobre o produto de dados: 1. Nome: "Vacinação Covid-19 e Tendência de Casos por Idade" 1. Descrição: "Estes dados vêm do CDC como parte do Departamento de Saúde dos E.U.A. & Serviços Humanos. Os dados contêm tendências de vacinação e casos por faixa etária, a nível nacional dos EUA. Os dados são estratificados por pelo menos uma dose e totalmente vacinados. Os dados também representam todos os parceiros de vacinação, incluindo clínicas de parceiros jurisdicionais, farmácias de retalho, instalações de cuidados de longa duração, centros de diálise, agência federal de gestão de emergência e sites parceiros de Administração de Serviços e Recursos de Saúde, e instalações federais de entidades."
- Tipo: Conjunto de Dados
- Selecione Avançar.
- Casos de utilização:
This data is provided for public use and is intended to help understand the trends of vaccination up take and new cases by different age groups. The ages are banded into two groups ranging from <2 years to 65+ years. Similarly the trends are provided in daily numbers that provide seven day average of new cases by age group. - Marcar como Endossado como verificado.
- Selecione Salvar.
Agora tem os metadados base do produto de dados incorporados. Em seguida, adicione algumas propriedades e mapeie o recurso a partir do Mapa de Dados.
Selecione Adicionar recursos de dados.
Verá os recursos que analisou no Mapa de Dados, incluindo todas as pastas e camadas da origem de dados.
Procure o recurso Covid19 Vaccine and Case Trends que adicionou ao contentor dourado do data lake e selecione este conjunto de recursos.
Selecione Adicionar. Pode selecionar o número de recursos necessários para um produto de dados, mas aqui só é necessário um.
Dica
Selecione Obter sugestões para que a AJUDA de IA gerada escolha a partir dos recursos no mapa de dados e selecione As Tendências da Vacina e do Caso Covid19 a partir de uma lista reduzida de resultados.
Agora pode ver o recurso adicionado ao seu produto de dados.
Selecione Adicionar termo junto ao título dos termos do glossário.
Selecione o termo Surto criado anteriormente e selecione Adicionar.
Deverá ver o elemento de dados crítico para o grupo etário do recurso mapeado para o produto de dados agora.
Selecione Adicionar OKR junto ao título OKR.
Selecione Reduzir o risco pandemia ao permitir a aceitação eficaz da vacina contra o paciente. É o objetivo que criou na primeira secção.
Gerir políticas de pedidos de acesso a produtos de dados
Na parte superior da página, o último passo antes de publicar o produto de dados é selecionar Gerir políticas. Aqui, pode configurar as políticas de acesso e pedir o fluxo de trabalho de acesso ao efetuar seleções e fornecer os nomes para aprovação. Também pode utilizar o separador Políticas herdadas para ver a política de domínio de governação aplicada ao atestado de cópias de dados que aplicou anteriormente. É o mesmo para a aprovação do Gestor necessária a partir do termo glossário do Surto.
Selecione o separador Gerir políticas .
Em Limite de tempo de acesso, forneça detalhes sobre quanto tempo o pedido de acesso é válido antes de ter de ser renovado. Defina este valor para conceder acesso até um ano.
Na caixa, introduza 1.
Selecione anos na lista pendente.
Em requisitos de aprovação, indique o seu nome na caixa aprovadores. (Requer o nome registado no Microsoft Entra ID.)
Observação
Não precisa de marcar aprovação do gestor porque essa política é herdada do termo glossário do surto.
Selecione Formulário de pedido de pré-visualização para ver o que os consumidores do catálogo veem ao pedir acesso. Verá o atestado de cópia de dados e a aprovação do gestor necessárias porque foram definidos pelo domínio de governação e pelo termo glossário.
Selecionar Salvar alterações.
Assim que mapear os recursos de dados e configurar as políticas de acesso, estará pronto para publicar o produto de dados no catálogo.
Selecione Publicar no produto de dados.
Experimente criar um Relatório de Lucro noutros domínios que criou anteriormente
- Relatório de Lucro, Tipo: Dashboards/relatórios.
- Product Master, Type: Dados de massa e dados de referência.
Observação
Pode adicionar muitos recursos a estes e ver o aspeto de um produto de dados com muitos recursos. Adicione os produtos de dados aos termos de qualquer domínio para ver como o glossário é utilizado para descrever os dados com um conjunto consistente de termos.
Passo 4: Executar a qualidade dos dados
Agora que tem um produto de dados disponível no catálogo, a execução de regras de qualidade de dados indica a todas as pessoas que os dados estão em boa forma e prontos para serem utilizados. À medida que aprende mais sobre os dados, adicione novas regras de qualidade de dados para garantir que são adequadas para todos os casos de utilização. Garantir que os produtos de dados têm a mais alta qualidade ajuda a criar confiança nos seus dados e mostra a outras pessoas que está a monitorizar e a melhorá-lo. À medida que o valor dos dados aumenta, tem de monitorizar e controlar mais detalhadamente a qualidade desses dados. Problemas de qualidade de dados mal geridos podem causar efeitos negativos significativos.
Pré-requisitos
- As regras de qualidade dos dados só podem ser executadas em tabelas de formato delta no ADLS Gen2 e no Microsoft Fabric.
- A Identidade Gerida do Microsoft Purview tem de estar ativada para ler a origem de dados, uma vez que é a única credencial suportada para a qualidade dos dados atualmente.
- Tem de ter a função de responsável pela qualidade dos dados no domínio de governação no qual está a executar a qualidade dos dados.
- Tem de ser o proprietário ou ter acesso de administrador de acesso de utilizador à origem de dados que está a ligar à análise da qualidade dos dados para garantir uma autorização de segurança adequada para analisar os dados.
- Tem de ter a função de responsável pelo perfil de dados para executar perfis nos seus dados.
Criar e executar regras de qualidade de dados
Abra o portal do Microsoft Purview.
Selecione Catálogo unificado.
Selecione o separador Qualidade dos dados em Gestão de dados.
Selecione o Domínio de Estado de Funcionamento Pessoal criado na secção 1.
Selecione Gerir e, em seguida, selecione Connections. Quando cria esta ligação, pode executar análises de qualidade de dados na sua origem de dados nesse domínio de governação. Este passo impede que as equipas obtenham acesso ao conhecimento dos dados sem autorização adequada.
Selecione Novo no ecrã de ligações para criar uma nova ligação: 1. Introduza o nome a apresentar "ADLSg2 DQ do Estado de Funcionamento Pessoal".
- Selecione o tipo de origem de Azure Data Lake Storage Gen2.
- Introduza os detalhes da origem de dados criada na secção 2.
Observação
A credencial tem de ser MICROSOFT Purview MSI (sistema) para uma ligação de qualidade de dados.
- Selecione Testar ligação.
- Assim que a ligação for testada, selecione Submeter.
- Introduza os detalhes da origem de dados criada na secção 2.
- Selecione o tipo de origem de Azure Data Lake Storage Gen2.
Assim que a ligação for estabelecida, estará pronto para executar perfis e começar a criar regras de qualidade de dados. Este passo garante que os especialistas que conhecem as regras de negócio e as regras adequadas estão em execução nos produtos de dados mais importantes.
- Voltar à página Qualidade dos dados.
- Selecione o domínio de governação do Estado de Funcionamento Pessoal.
- Selecione o produto de dados Covid-19 Vacinação e Tendência de Casos por Idade incorporado na secção 3.
- Selecione o recurso que adicionou ao produto de dados. (Tem de estar no formato delta da secção 2 ou a qualidade dos dados não será executada).
- Aplique regras de qualidade de dados às colunas dos dados a medir se corresponderem às suas expectativas de qualidade:
- Selecione o separador Regras no recurso selecionado.
- Selecione Nova regra.
- Selecione Regra de campos vazios/em branco.
- Introduza os detalhes:
- Selecione a coluna AgeGroupVacc no menu pendente da coluna
- Nome da Regra: Confirmar a Existência do Grupo Etário da Vacinação
- Selecione Criar.
- Selecione Nova regra.
- Selecione Correspondência de tipo de dados.
- Introduza os detalhes.
- Selecione DataAdicionar coluna.
- Selecione Criar.
- Selecione Executar Análise de qualidade dos dados.
Dados de perfil
Crie um perfil para os seus dados para ver as estatísticas de alto nível de cada coluna e descobrir quaisquer anomalias que possam exigir uma nova regra.
- Em Catálogo unificado, selecione Gestão de estado de funcionamento e, em seguida, selecione Qualidade dos dados.
- Selecione Dados do perfil.
- Selecione a caixa superior junto a Nome da coluna para criar perfis para todas as colunas. O sistema recomenda as colunas a criar perfis e pode selecionar colunas que sabe que valem a pena criar perfis para ajudar a impedir perfis em dados altamente confidenciais ou dados que sabe serem pouco preenchidos.
- Selecione Executar perfil.
Quando a análise for concluída, pode rever a classificação e o perfil da qualidade dos dados do seu novo produto de dados. Todos os utilizadores do catálogo podem ver a classificação de qualidade dos dados, para que todos conheçam os status dos dados.
Crie uma agenda para as análises de qualidade de dados para garantir que está continuamente a monitorizar problemas de qualidade dos dados. Defina alertas para se certificar de que está a resolver problemas de qualidade dos dados antes de os consumidores serem afetados.
- Em Gestão do estado de funcionamento, selecione Qualidade dos dados.
- Selecione o domínio Do Estado de Funcionamento Pessoal onde configurou as regras de qualidade dos dados.
- Na lista pendente Gerir , selecione Análises agendadas.
- Na página Análises agendadas , selecione Novo.
- Adicionar detalhes da Descrição Geral
- Nome: Avaliação Mensal do DQ do Estado de Funcionamento Pessoal
- Descrição: análise mensal das regras de DQ para obter melhorias contínuas.
- Selecione Continuar
- Selecione o âmbito da análise
- Selecione a caixa junto ao produto de dados Vacinação Covid-19 e Tendência de Casos por Idade
- Selecione Continuar
- Agende a análise para garantir que é executada no último dia de cada mês
- Selecione Recorrente
- Periodicidade: a cada um mês
- Dias do mês: Último
- Hora de análise de agendamento (UTC): 12:00:00
- Iniciar periodicidade às (UTC): deixe como predefinição
- Selecione Continuar
- Reveja os detalhes da análise para ver se existem alterações que pretenda efetuar antes de guardar.
- Selecione Salvar. Uma vez que acionou uma análise manual anteriormente, não precisa de acionar outra análise agora. Se precisar de uma nova análise, selecione Guardar e executar.
Configurar alertas
Após agendar análises para a qualidade dos dados, pode configurar alertas para notificar os responsáveis sobre problemas ou quando os problemas de qualidade dos dados ou falhas de análise precisam de atenção. Configure um alerta de qualidade de dados para análises falhadas e quando a classificação diminui mais de 5%.
- Regresse ao domínio Do Estado de Funcionamento Pessoal na página Qualidade dos dados .
- Na lista pendente Gerir , selecione Alertas.
- Selecione Novo.
- Introduzir detalhes do alerta
- Nome a Apresentar: Análise Mensal do DQ do Estado de Funcionamento Pessoal
- Descrição: para garantir que os limiares mínimos de DQ estão a satisfazer as expectativas dos consumidores.
- Destino: a classificação diminui em mais do que
- Limiar: 5
- Desativar notificações: deixe desmarcado
- Ativar a notificação para análises de qualidade falhadas: deixar selecionada
- Destinatário: introduza o seu nome
- Selecione Continuar.
Dica
Ao implementar no Catálogo unificado, envie os alertas aos administradores que podem notificar os consumidores do problema e trabalhar com o proprietário técnico dos dados para efetuar correções.
No final desta secção, tem um Catálogo unificado funcional com qualidade de dados operacionais para gerir os dados que está a oferecer aos consumidores de dados organizacionais. Tudo está configurado para obter os dados mais valiosos para o consumidor e criar confiança nos dados que utilizam. À medida que o valor dos dados aumenta e surgem novas estratégias de dados, a secção seguinte mostra como pode gerir todo o catálogo ou aprofundar a gestão de dados específica com master dados.
Passo 5: Gestão de dados principal
A gestão de dados principais (MDM) é a prática de conformidade com as entidades de dados mais importantes que têm de ser precisas, exclusivas e aplicadas de forma consistente em todas as áreas da empresa, porque os erros e problemas nestes dados podem afetar toda a empresa. Através de um dos nossos parceiros mdm, pode integrar a sua escolha de soluções mdm com o Microsoft Purview para permitir a unificação, uniformização e limpeza de dados que permite a criação de registos dourados e a publicação de master dados como produtos de dados.
Siga os tutoriais aqui para obter a sua solução de eleição: Gestão de dados mestra no Microsoft Purview
Passo 6: Gerir o estado de funcionamento dos dados
Na área Gestão do estado de funcionamento do Catálogo unificado, o escritório de dados central e outros gestores de dados podem avaliar a status dos dados em relação às normas da empresa e gerir eficazmente o progresso para a sua estratégia. Para garantir que todas as pessoas na empresa sabem o que podem fazer para aumentar o valor dos seus dados, é essencial que as normas sejam compreendidas e dimensionáveis para toda a organização sem necessidade de tornar todos especialistas em governação de dados. A partir de um conjunto padrão de controlos da indústria que estão disponíveis de forma inicial, cada escritório de dados pode personalizar os controlos para satisfazer as suas expetativas e garantir que estão alinhados com os seus objetivos de dados. Fundamental para a eficácia destes controlos não é apenas a medição destas normas, mas também garantir que os responsáveis pelos dados podem tomar medidas por si próprios e ser responsabilizados por fazerem as melhorias que afetam o valor dos dados. No Data Estate Health, pode definir e gerir todas estas capacidades críticas.
Pré-requisitos
- Produtos de dados, termos do glossário e outros conceitos empresariais publicados no Catálogo unificado. Pode seguir as secções anteriores para criar estes conceitos:
- Pelo menos 24 horas desde a curadoria de produtos de dados.
- Tem de ter a função Proprietário do Estado de Funcionamento dos Dados no Catálogo unificado.
Avaliar a governação de dados com o estado de funcionamento do património de dados
Abra o portal do Microsoft Purview.
Selecione Catálogo unificado.
Em Estado de Funcionamento do Património de Dados no painel de navegação esquerdo, selecione Controlos de estado de funcionamento.
Selecione a cenoura > junto ao grupo de controlo Criação de Valores .
Ao pairar o cursor sobre um título de controlo, selecione o ícone de lápis para editar o controlo. Ao editar o controlo, altera o limiar do controlo para definir expectativas sobre qual deve ser a classificação e definir a classificação de cores para demonstrar as fases de progresso.
Os detalhes permitem-lhe fornecer uma descrição do controlo e o que significa para a sua organização e definir um proprietário para um controlo específico.
Selecione o separador Regras do controlo para alterar o limiar. Esta definição tem um alvo elevado e, se não estiver em bom estado de funcionamento, é fundamental dar seguimento.
- Herdar do grupo: alterne para desativar (deve ficar cinzento).
- Pontuação de destino: 90
- Selecione Nova regra.
- Defina a caixa junto à classificação como GreaterThanOrEqual
- Definir a percentagem como 90
- Estado = Estado de funcionamento (verde)
- Estado da Caixa else = Crítico (Roxo)
- Selecione Salvar.
Em Estado de funcionamento do património de dados, selecione Qualidade dos metadados.
Aqui, pode alterar ou adicionar regras que criam as classificações do controlo. Aqui, quer alterar a gravidade das ações de Criação de Valor para garantir que todos os utilizadores sabem a importância desta ação.
- Selecione Configurar gravidade
- Selecione o grupo de controlo Criação de Valores
- Selecione o título do controlo de alinhamento DE OKRs de Negócio
- Altere a Gravidade de Média para Alta e selecione Guardar
- Selecione o separador Ações de estado de funcionamento
- Filtro Atribuído a: para o seu nome
- Selecione uma ação onde possa ver o que o proprietário da ação precisa de fazer para garantir que as expectativas de governação são satisfeitas ou que pode atribuir um novo proprietário para obter o melhor especialista para fornecer os seus contributos. Existe também uma status que permite que outras pessoas saibam que trabalho está em curso e onde outras ações podem precisar de atribuição de prioridades.
Passo 7: democratização dos dados
A democratização de dados permite que os utilizadores localizem e acedam aos dados de que precisam de forma compatível. Garante que as pessoas conseguem encontrar os dados de que precisam para criar valor comercial. Catálogo unificado fornece uma experiência limpo e fácil de detetar dados. Permite aos administradores atualizar e gerir os dados disponibilizados no catálogo em escala. Nesta secção, vai aprender como os utilizadores podem encontrar e pedir acesso aos dados e garantir que os aprovadores adequados podem controlar e fornecer entradas nesses pedidos de acesso.
Pré-requisitos
- Passos concluídos 1 a 4 no mínimo:
- Uma função de leitor de catálogo num domínio de governação
Descobrir produtos de dados
- Em Catálogo unificado, selecione Deteção e, em seguida, selecione Produtos de dados.
- Na página Produtos de dados , utilize a barra de pesquisa para procurar taxas de vacinação por idade.
- Aqui, verá os produtos de dados que publicou na secção 2. Esta vista mostra como os utilizadores só veem os dados que lhes são destinados e impede que os utilizadores tenham de navegar num património de dados altamente técnico.
- Selecione o produto de dados Vacinação Covid-19 e Tendência de Casos por Idade
- Aqui, os consumidores podem ver os metadados que forneceu e qualquer uma das outras propriedades que configurou durante a configuração. A classificação de qualidade dos dados também está aqui para que os consumidores saibam a qualidade antes mesmo de terem acesso aos dados.
- Selecione o recurso e o consumidor pode ver todas as colunas disponíveis no recurso de dados.
- Selecione o termo Glossário do surto e o consumidor pode ver a descrição e outras informações sobre o termo para obter uma compreensão mais profunda dos dados.
- Assim que o consumidor estiver confiante de que pretende utilizar esses dados, tem de obter acesso aprovado aos dados.
- Selecione Pedir acesso
- Preencha os detalhes do formulário para submeter um pedido.
- Utilizador: deixe o seu nome
- Aprovação do Gestor: automaticamente necessária e direcionada para o gestor de ID do Microsoft Entra.
- Objetivo: selecione uma finalidade
- Justificação comercial: monitorização OKR
- Selecione a caixa junto ao atestado para dizer que compreende as expetativas de utilização destes dados.
- Selecione Enviar.
O pedido de acesso é agora enviado para o gestor listado no Microsoft Entra ID. A partir daqui, o gestor pode aceder aos pedidos ao abrir o e-mail e selecionar uma ligação ou ao aceder ao Microsoft Purview. A aprovação e a gestão do acesso podem ser feitas diretamente no Microsoft Purview.
- Em Catálogo unificado, selecione Gestão do catálogo e, em seguida, selecione Pedidos.
- Selecione o domínio Estado de Funcionamento Pessoal .
- Selecione o pedido que submeteu.
- Agora, os aprovadores podem aprovar ou recusar ao selecionar Responder no pedido.