Compartilhar via


Construtor de gêmeos digitais (versão prévia) no tutorial Real-Time Intelligence: Introdução

O construtor de gêmeos digitais (versão prévia) é um novo item dentro da carga de trabalho Real-Time Intelligence no Microsoft Fabric. Ele cria representações digitais de ambientes do mundo real para otimizar operações físicas usando dados.

Importante

Esse recurso está na versão prévia.

Neste tutorial, você aprenderá a configurar um item do construtor de gêmeos digitais e usá-lo para criar uma ontologia que contextualiza dados de exemplo transmitidos de um fluxo de eventos. Depois de criar a ontologia no construtor de gêmeos digitais, você usa atalhos para expor os dados em um repositório de eventos e consultá-los usando consultas KQL (Linguagem de Consulta Kusto). Em seguida, você visualiza esses resultados de consulta em um painel de Real-Time.

Pré-requisitos

Cenário

O cenário de exemplo usado neste tutorial é um conjunto de dados de ônibus, contendo informações sobre movimentações e locais de ônibus. Usando o construtor de gêmeos digitais (versão prévia) para contextualizar e modelar os dados, você pode analisar e estimar o comportamento de ônibus.

Essa análise inclui estimar se um ônibus estará atrasado na próxima parada, ao mesmo tempo em que usa dados de localização no nível do bairro para analisar padrões de atraso. A análise pode ser usada para estimar atrasos em paradas individuais e identificar tendências geográficas, como quais paradas e bairros enfrentam atrasos mais frequentes.

Resumo de dados

Neste tutorial, você combina dados de duas fontes de dados: movimentação e tempo de ônibus em tempo real (dados de fatos) e dados precisos e contextuais de paradas de ônibus geográficas (dados dimensionais). Contextualizar os dados do barramento no construtor de modelos digitais gêmeos (versão prévia) permite uma análise dinâmica e oferece insights operacionais. A incorporação de dados de parada de ônibus estática estabelece uma base para análise localizada e identificação de padrões de atraso. Além disso, os dados de propriedade e localidade do bairro dos dados de parada permitem entender as tendências geográficas mais amplas e a eficiência geral do trânsito.

As tabelas a seguir resumem os dados incluídos em cada fonte de dados.

Dados do barramento

Esse conjunto de dados são dados em tempo real que fornecem informações sobre movimentações de ônibus. A transmissão é feita pela Real-Time Intelligence.

Campo Descrição
Timestamp O tempo em que o instantâneo de dados foi tirado (tempo do sistema em tempo real).
TripId O identificador único para cada instância de viagem, como uma viagem de ônibus específica em uma rota. Útil para acompanhar viagens de ônibus individuais.
BusLine O número da rota, como 110 ou 99. Útil para agrupar viagens e paradas para detecção de padrões em linhas específicas.
StationNumber A sequência de paradas dentro de uma viagem (1 sendo a primeira parada). Útil para acompanhar como um ônibus progride ao longo de uma rota.
ScheduleTime A hora agendada em que o ônibus deve chegar à próxima estação em sua rota. Útil para calcular atrasos.
Properties Um campo JSON que contém dois valores: BusState que pode ser InMotion ou Arrived (indica o status de movimentação) e TimeToNextStation, que é o tempo estimado restante para chegar à próxima parada. Essa coluna de campo JSON precisa ser separada para uso no construtor de gêmeos digitais (versão prévia).

Dados de ponto de ônibus

Esse conjunto de dados são dados dimensionais sobre paradas de ônibus. Ele fornece informações contextuais (simuladas) sobre onde as paradas estão localizadas. Esses dados são carregados como um arquivo estático no lakehouse do tutorial.

Campo Descrição
Stop_Code O identificador exclusivo do ponto de ônibus.
Stop_Name O nome do ponto de ônibus, como Abbey Wood Road.
Latitude A latitude do ponto de ônibus. Útil para visualizações de mapas ou calcular distâncias entre paradas.
Longitude A longitude do ponto de ônibus. Útil para visualizações de mapas ou calcular distâncias entre paradas.
Road_Name A estrada onde a parada está localizada. Útil para identificar tendências específicas da estrada.
Borough O bairro onde a parada está localizada, como Greenwich. Útil para agregação e análise geográfica.
Borough_ID Uma ID numérica para o bairro. Pode ser usado para integrar conjuntos de dados em nível de bairro.
Suggested_Locality O bairro ou área local à qual a parada pertence, como Abbey Wood. Mais granular do que o bairro e útil para análise local.
Locality_ID Um identificador numérico para a localidade.

Etapas do tutorial

Neste tutorial, você concluirá as seguintes etapas para desenvolver o cenário de dados do ônibus:

  • Configurar seu ambiente e carregar dados de exemplo estáticos e contextuais em um lakehouse
  • Processar dados de streaming e levá-los para a lakehouse
  • Criar uma ontologia no construtor de gêmeos digitais (versão prévia)
  • Projetar os dados de ontologia no Eventhouse usando um notebook do Fabric
  • Criar consultas KQL e um Painel de Real-Time para explorar e visualizar os dados

Próxima etapa