Definición de los flujos de datos

Completado

Un flujo de datos consta de una serie perpetua de datos, normalmente relacionados con eventos específicos en un momento dado. Por ejemplo, un flujo de datos puede contener detalles de los mensajes enviados a un sitio de micro-blogging de redes sociales o una serie de medidas medioambientales que registra un sensor meteorológico conectado a Internet. El análisis de datos de streaming se usa con más frecuencia para comprender mejor el cambio que se produce a lo largo del tiempo. Por ejemplo, una organización de marketing puede realizar análisis de sentimiento en mensajes de redes sociales para ver si una campaña publicitaria tiene como resultado comentarios más positivos sobre la empresa o sus productos, o bien una empresa agrícola podría supervisar las tendencias de temperatura y lluvia para optimizar el riego y la cosecha de cultivos.

Entre los objetivos comunes de Stream Analytics se incluyen los siguientes

  • Analizar continuamente los datos para notificar problemas o tendencias.
  • Describir el comportamiento del componente o del sistema bajo varias condiciones para ayudar a planear futuras mejoras.
  • Desencadenar acciones o alertas específicas cuando se producen determinados eventos o se superan ciertos umbrales.

Características de las soluciones de procesamiento de flujos

Las soluciones de procesamiento de flujos suelen mostrar las características siguientes:

Diagrama que muestra un flujo de datos que incluye un campo de fecha y hora que se está procesando, agregado por día y visualizados y almacenados.

  1. El flujo de datos de origen es ilimitado, los datos se agregan a la secuencia de forma perpetua.
  2. Cada registro de datos de la secuencia incluye datos temporales (basados en tiempo) que indican cuándo se produjo el evento al que se relaciona el registro (o se registró).
  3. La agregación de datos de streaming se realiza a través de ventanas temporales, por ejemplo, registrando el número de publicaciones en redes sociales por minuto o la precipitación media por hora.
  4. Los resultados del procesamiento de datos de streaming se pueden usar para admitir la automatización o visualización en tiempo real (o casi en tiempo real), o bien conservarse en un almacén analítico para combinarse con otros datos para el análisis histórico. Muchas soluciones combinan estos enfoques para admitir los análisis históricos y en tiempo real.