Roles en los datos

Completado

La narración de historias mediante datos es un proceso que normalmente no comienza por usted. Los datos tienen que venir de alguna parte. Transportar esos datos a un lugar donde usted pueda usarlos requiere esfuerzo, y es probable que no esté bajo su control, sobre todo en un contexto corporativo.

Las aplicaciones y los proyectos actuales pueden ser grandes y complejos, y a menudo implican el uso de habilidades y conocimientos de muchas personas. Todos los individuos aportan un talento y una experiencia particulares y todos trabajan de manera conjunta, coordinando tareas y responsabilidades, para avanzar un proyecto desde su nacimiento hasta su finalización.

Hace poco tiempo, roles como los de analistas de negocios y desarrolladores de inteligencia empresarial eran los habituales para el procesamiento y la comprensión de los datos. Pero el aumento excesivo del tamaño de los datos y sus diferentes tipos ha provocado que estos roles evolucionen hacia conjuntos de aptitudes más especializadas que modernizan y simplifican los procesos de ingeniería y análisis de datos.

En las siguientes secciones, se resaltan los distintos roles en los datos y su responsabilidad específica en todo el espectro de la detección y comprensión de los datos:

  • Analista de negocios

  • Analista de datos

  • Ingenieros de datos

  • Ingeniero analítico

  • Científico de datos

Analista de negocios

Aunque existen algunas similitudes entre un analista de datos y un analista de negocios, el diferenciador clave entre ambos es lo que hacen con los datos. Un analista de negocios está más cerca de la empresa y es un especialista en la interpretación de los datos que proceden de la visualización. A menudo, las tareas del analista de datos y del analista de negocios pueden ser responsabilidad de una misma persona.

Analista de datos

Un analista de datos permite a las empresas maximizar el valor de sus activos de datos a través de herramientas de visualización y generación de informes, como Microsoft Power BI. El analista de datos se encarga de la generación de perfiles, la limpieza y la transformación de los datos. Sus responsabilidades también incluyen el diseño y la creación de modelos semánticos escalables y eficaces, y la habilitación e implementación de las funciones de análisis avanzado en informes para su análisis. Un analista de datos trabaja con las partes interesadas pertinentes para identificar los requisitos de datos y de creación de informes necesarios y, después, se encarga de convertir los datos sin procesar en conclusiones relevantes y significativas.

Un analista de datos también es responsable de la administración de activos de Power BI, como los informes, los paneles, los espacios de trabajo y los modelos semánticos subyacentes que se utilizan en los informes. Tienen la tarea de implementar y configurar procedimientos de seguridad adecuados, junto con los requisitos de las partes interesadas, para garantizar la seguridad de todos los activos de Power BI y de sus datos.

Ingenieros de datos

Los ingenieros de datos aprovisionan y configuran las tecnologías de la plataforma de datos local y en la nube. Administran y protegen el flujo de datos estructurados y no estructurados procedentes de múltiples orígenes. Entre las plataformas de datos que usan están las bases de datos relacionales, las bases de datos no relacionales, los flujos de datos y los almacenes de archivos. Los ingenieros de datos también garantizan que los servicios de datos se integren de forma segura y sin problemas en todas las plataformas de datos.

Las principales responsabilidades de los ingenieros de datos incluyen el uso de servicios y herramientas de datos locales y en la nube para extraer, transformar y cargar datos de múltiples orígenes. Los ingenieros de datos colaboran con las partes interesadas de la empresa para identificar los requisitos de los datos y cumplir con estos. Además, diseñan e implementan soluciones.

Aunque podría haber cierta semejanza entre las tareas y responsabilidades de un ingeniero de datos y un administrador de bases de datos, el ámbito de trabajo de un ingeniero de datos no se limita al mantenimiento de una base de datos y del servidor en el que se hospeda, y es probable que no incluya la administración general de los datos operativos.

El ingeniero de datos añade un valor enorme a los proyectos de ciencia de datos y de inteligencia empresarial. Cuando el ingeniero de datos agrupa los datos, lo que se suele describir como limpieza y transformación de los datos, los proyectos avanzan más rápidamente porque los científicos de datos pueden centrarse en sus áreas de trabajo específicas.

Como analista de datos, trabajará junto a un ingeniero de datos para asegurarse de que puede acceder a los distintos orígenes de datos estructurados y no estructurados, ya que le ayudarán a optimizar los modelos semánticos que normalmente se sirven desde un almacén de datos o lago de datos moderno.

Ingeniero analítico

Los ingenieros de análisis unen la ingeniería y el análisis de datos; para ello, seleccionan los activos de datos en lagos de datos o almacenes de lagos de datos, lo que garantiza la calidad de los datos y habilita el análisis de autoservicio. Crean modelos semánticos en Power BI para preparar y servir datos de forma eficaz. También pueden preparar otros lugares para guardar datos, como los almacenes de datos o los almacenes de lago de datos.

Existe cierta superposición con el rol del ingeniero de datos, ya que ambos pueden usar SQL como lenguaje de consulta en los almacenes de datos y ambos se centran en la calidad de los datos. Los ingenieros de datos suelen construir las canalizaciones y la infraestructura fundamentales. Los ingenieros de análisis están más cerca de la actividad empresarial, y se centran en el modelado y en lograr que los datos se puedan usar para generar informes o tomar decisiones.

Científico de datos

Los científicos de datos realizan un análisis avanzado para extraer valor de los datos. Su trabajo puede pasar del análisis descriptivo al análisis predictivo. El análisis descriptivo evalúa los datos a través de un proceso conocido como análisis de datos exploratorio (EDA). El análisis predictivo se usa en el machine learning para aplicar técnicas de modelado que puedan detectar anomalías o patrones. Estos análisis son una parte importante de los modelos de previsión.

El análisis descriptivo y el predictivo solo representan aspectos parciales del trabajo de los científicos de datos. Algunos científicos de datos pueden adentrarse en el aprendizaje profundo, y realizan experimentos iterativos para resolver un problema de datos complicado mediante algoritmos personalizados complejos.

Las pruebas menos formales sugieren que la mayor parte del trabajo de un proyecto de ciencia de datos se invierte en la limpieza y transformación de datos y en la ingeniería de características. Los científicos de datos pueden acelerar el proceso de experimentación cuando los ingenieros de datos usan sus conocimientos para limpiar y transformar correctamente los datos.

A simple vista, es posible que parezca que el trabajo de un científico de datos y un analista de datos son muy distintos, pero no es así. Un científico de datos examina los datos para determinar las preguntas que necesitan respuestas y, a menudo, diseñará una hipótesis o un experimento y, luego, recurrirá al analista de datos para que le ayude con la visualización de datos y la creación de informes.