Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El generador de gemelos digitales (versión preliminar) es un nuevo elemento dentro de la carga de trabajo de inteligenciaReal-Time en Microsoft Fabric. Crea representaciones digitales de entornos reales para optimizar las operaciones físicas mediante datos.
Importante
Esta característica se encuentra en versión preliminar.
En este tutorial, aprenderá a configurar un elemento de generador de gemelos digitales y usarlo para crear una ontología que contextualice los datos de ejemplo transmitidos desde una secuencia de eventos. Después de compilar la ontología en el generador de gemelos digitales, use métodos abreviados para exponer los datos en un centro de eventos y consultarlos mediante consultas de KQL (lenguaje de consulta kusto). A continuación, usted visualizará estos resultados de consulta en un tablero de Real-Time.
Prerrequisitos
- Un área de trabajo con una capacidad habilitada para Microsoft Fabric.
- Generador de gemelos digitales (versión preliminar) habilitado en el arrendatario.
Los administradores de Fabric pueden conceder acceso al generador de gemelos digitales en el portal de administración. En la configuración del tenant, habilite Digital Twin Builder (versión preliminar).
El cliente no puede tener habilitada la facturación automática por escalado para Spark, ya que el generador de gemelos digitales no es compatible con esta función. Esta configuración también se administra en el portal de administración.
Escenario
El escenario de ejemplo que se usa en este tutorial es un conjunto de datos de bus, que contiene información sobre los movimientos y ubicaciones de autobús. Mediante el uso del generador de gemelos digitales (versión preliminar) para contextualizar y modelar los datos, puede analizar y calcular el comportamiento del bus.
Este análisis incluye la estimación de si un autobús estará tarde en la siguiente parada, mientras que también usa datos de ubicación de nivel de distrito para analizar patrones de retraso. El análisis se puede usar para calcular retrasos en paradas individuales e identificar tendencias geográficas, como las paradas y los distritos experimentan retrasos más frecuentes.
Resumen de datos
En este tutorial, combinará datos de dos fuentes de datos: datos de movimiento y tiempo de autobuses en tiempo real (datos de hechos) y datos geográficos y contextuales precisos de paradas de autobús (datos dimensionales). La contextualización de los datos de bus en el generador de gemelos digitales (versión preliminar) permite el análisis dinámico y la información operativa. La incorporación de datos de parada de bus estático establece una base para el análisis localizado y la identificación de patrones de retraso. Además, los datos de propiedad y localidad del municipio de los datos de parada permiten comprender las tendencias geográficas más amplias y la eficiencia general del tránsito.
En las tablas siguientes se resumen los datos incluidos con cada origen de datos.
Datos de bus
Este conjunto de datos es datos en tiempo real que proporcionan información sobre los movimientos de autobús. Se transmite a través de Real-Time Intelligence.
| Campo | Descripción |
|---|---|
Timestamp |
Hora en que se tomó la instantánea de datos (tiempo del sistema en tiempo real). |
TripId |
Identificador único de cada instancia de viaje, como un trayecto específico de un autobús en una ruta. Útil para realizar un seguimiento de los viajes individuales de autobús. |
BusLine |
Número de ruta, como 110 o 99. Resulta útil para agrupar viajes y paradas para la detección de patrones en líneas específicas. |
StationNumber |
Secuencia de parada en un viaje (1 es la primera parada). Resulta útil para realizar un seguimiento de cómo progresa un autobús a lo largo de una ruta. |
ScheduleTime |
Hora programada en la que el autobús debe llegar a la siguiente estación en su ruta. Útil para calcular retrasos. |
Properties |
Campo JSON que contiene dos valores: BusState que pueden ser InMotion o Arrived (indica el estado del movimiento) y TimeToNextStation, que es el tiempo estimado restante para alcanzar la siguiente detención. Esta columna de campo JSON debe separarse para su uso en el generador de gemelos digitales (versión preliminar). |
Datos de parada de autobús
Este conjunto de datos es datos dimensionales sobre las paradas de bus. Proporciona información contextual (simulada) sobre dónde se encuentran las paradas. Estos datos se cargan como un archivo estático en el tutorial lakehouse.
| Campo | Descripción |
|---|---|
Stop_Code |
Identificador único de la parada de autobús. |
Stop_Name |
El nombre de la parada de autobús, como Abbey Wood Road. |
Latitude |
Latitud de la parada de autobús. Resulta útil para las visualizaciones de mapa o para calcular distancias entre paradas. |
Longitude |
Longitud de la parada de autobús. Resulta útil para las visualizaciones de mapa o para calcular distancias entre paradas. |
Road_Name |
Carretera donde se encuentra la parada. Resulta útil para identificar tendencias específicas de la carretera. |
Borough |
El distrito donde se encuentra la parada, como Greenwich. Útil para la agregación y el análisis geográfico. |
Borough_ID |
Un identificador numérico para el municipio. Podría usarse para combinar con conjuntos de datos de nivel de distrito. |
Suggested_Locality |
El vecindario o la zona local a la que pertenece la parada, como Abbey Wood. Más granular que el distrito y útil para el análisis local. |
Locality_ID |
Identificador numérico de la localidad. |
Pasos del tutorial
En este tutorial, completará los pasos siguientes para crear el escenario de datos de bus:
- Configura tu entorno y sube datos de ejemplo estáticos y contextuales a un Lakehouse.
- Procesar datos de streaming y llevarlos al lakehouse
- Creación de una ontología en el generador de gemelos digitales (versión preliminar)
- Project the ontology data to Eventhouse by using a Fabric notebook (Proyectar los datos de ontología a Eventhouse mediante un cuaderno de Fabric)
- Crea consultas KQL y un panel de control Real-Time para explorar y visualizar los datos