Compartir a través de


Preparación de las operaciones en la nube de Azure

La administración del entorno de Azure no es solo mantener encendidas las luces. Se trata de mantener la gobernanza y la seguridad, a la vez que garantiza que la nube se alinee con los objetivos empresariales a lo largo del tiempo. A medida que crece el entorno, debe evitar el desfase de configuración, mejorar las implementaciones a través de la infraestructura como código y administrar los cambios de forma eficaz.

La metodología de administración de Cloud Adoption Framework (CAF) presenta el enfoque ramp (Ready, Manage, Monitor, Protect) para ayudarle a crear estas funcionalidades. RAMP proporciona una manera estructurada de organizar equipos, definir responsabilidades e implementar los procesos y herramientas que mantienen las operaciones de Azure seguras, compatibles y resistentes. Desde la administración diaria hasta la supervisión del estado y la protección contra las interrupciones, RAMP le ayuda a establecer una base operativa sólida para el éxito a largo plazo.

Diagrama que muestra el proceso de gestión de CAF: preparar, administrar, supervisar y proteger (RAMP).

Identificación de las responsabilidades de administración

La administración eficaz de Azure abarca dos niveles de responsabilidad: responsabilidades centrales (plataforma) y responsabilidades de carga de trabajo . Las responsabilidades centrales se aplican en todo el patrimonio de la nube. Las responsabilidades de carga de trabajo se centran en aplicaciones o servicios individuales. Uso de la tabla 1 para asegurarse de que el modelo operativo cubre las áreas esenciales de la administración de la nube

Tabla 1. Responsabilidades de administración de la nube principal

Áreas de administración de la nube Responsabilidades centrales (plataforma) Responsabilidades de carga de trabajo
Compliance ▪ Definir procedimientos operativos.
▪ Aplicar directivas de gobernanza.
Supervise el cumplimiento y corrija o escale según sea necesario.
▪ Siga los procedimientos operativos.
▪ Alinee el diseño con las directivas de gobernanza.
Security ▪ Administrar las operaciones de seguridad de toda la organización.
▪ Administrar identidades en microsoft Entra ID.
▪ Conceda acceso a las suscripciones de Azure.
▪ Defina y mantenga las líneas base de seguridad a través de Azure Policy y Microsoft Defender for Cloud.
▪ Supervise la integración de la protección contra amenazas y la respuesta a incidentes con Microsoft Sentinel.
▪ Implemente el diseño seguro de cargas de trabajo.
▪ Responder a incidentes e alertas de seguridad específicas de la carga de trabajo.
▪ Evalúe continuamente las vulnerabilidades dentro de la carga de trabajo.
Administración de recursos ▪ Defina y mantenga la jerarquía de recursos.
▪ Cree suscripciones de carga de trabajo según se solicite.
▪ Defina la estrategia de nomenclatura y etiquetado.
▪ Defina la topología de red.
▪ Configure redes compartidas (emparejamiento de redes virtuales, conectividad local).
▪ Administrar recursos o servicios compartidos entre diferentes cargas de trabajo.
▪ Supervise los límites de suscripción y controle las solicitudes de aumentos de cuota.
▪ Administrar suscripciones de carga de trabajo específicas (si están delegadas).
▪ Administrar grupos de recursos y recursos para cada carga de trabajo.
▪ Cumplir y aplicar estándares de nomenclatura y etiquetado.
▪ Administre el uso de recursos de nivel de aplicación, lo que garantiza que los recursos permanecen dentro de las cuotas de suscripción.
Despliegue ▪ Estandarizar y controlar canalizaciones y herramientas de CI/CD (Azure DevOps, Acciones de GitHub).
▪ Defina plantillas de infraestructura como código de referencia (Bicep, Terraform, plantillas de ARM).
▪ Proporcione procedimientos recomendados centrales para la seguridad de la canalización (análisis de código, administración de secretos).
▪ Use el marco de CI/CD central y las plantillas de IaC para las implementaciones de cargas de trabajo.
▪ Implemente tareas de implementación específicas de la carga de trabajo (configure la configuración de la aplicación, la base de datos).
▪ Adapte las plantillas de referencia a las necesidades de carga de trabajo al tiempo que respeta las directrices centrales.
Desarrollo ▪ Proporcionar y aplicar cadenas de herramientas y marcos de desarrollo estandarizados para acelerar la coherencia (estándares de codificación, procedimientos recomendados de DevOps).
▪ Mantenga repositorios internos o fuentes de paquetes para bibliotecas o módulos compartidos.
▪ Adopte y adapte las cadenas de herramientas estándar para el desarrollo de cargas de trabajo.
▪ Posee el ciclo de vida de la aplicación e incorpora procedimientos recomendados (pruebas unitarias, pruebas de integración).
▪ Gestione la mejora continua del código base de las cargas de trabajo.
Monitorización ▪ Planear la estrategia de supervisión.
Alerta sobre las responsabilidades centralizadas.
▪ Proporcione paneles para métricas operativas comunes en todo el entorno.
▪ Supervisión de la carga de trabajo
▪ Amplíe o ajuste las alertas centrales para capturar condiciones específicas de la carga de trabajo.
▪ Investigue y corrija incidentes de nivel de carga de trabajo en función de las alertas y los registros.
Cost ▪ Asignar presupuestos globales o de nivel de suscripción a la nube
▪ Supervise el gasto en la nube en toda la organización y cree informes de costos.
▪ Asigne costos a unidades de negocio o productos, normalmente mediante etiquetas o modelos de asignación de costos personalizados.
▪ Aplicar la estrategia de etiquetado para la asignación de costos.
Optimizar costos en el diseño de cargas de trabajo
▪ Respetar las restricciones presupuestarias.
Reliability ▪ Defina los requisitos de confiabilidad (SLO, RPO, RTO) por prioridad de carga de trabajo.
▪ Proporcione instrucciones sobre la continuidad empresarial y la recuperación ante desastres (BCDR).
▪ Administrar soluciones de recuperación ante desastres centralizadas.
▪ Apoyar la gestión de incidentes mayores en todas las cargas de trabajo.
▪ Diseñe la carga de trabajo para cumplir los requisitos de confiabilidad.
Performance ▪ Supervise y mantenga el rendimiento en componentes centralizados (red central, servicios compartidos).
▪ Proporcione instrucciones para la optimización del rendimiento y el planeamiento de la capacidad.
▪ Supervisión de la cuota
▪ Diseñe la carga de trabajo para mejorar el rendimiento.

Establecimiento de las operaciones en la nube

Use las responsabilidades descritas en la tabla 1 para crear una base operativa eficaz. Defina claramente los equipos, los estándares y los procesos siguiendo estos pasos:

  1. Defina el modelo de operaciones en la nube. Elija un modelo operativo centralizado, compartido o descentralizado en la nube en función del tamaño y la madurez de su organización. Para obtener instrucciones, consulte Elección de un modelo operativo en la nube.

  2. Asigne responsabilidades de la plataforma central. Formar un equipo dedicado para controlar las tareas de administración central. Desarrolle una matriz de aptitudes de la tabla 1 para identificar la experiencia necesaria.

  3. Asigne responsabilidades de carga de trabajo. Configure equipos especializados para tareas específicas de la carga de trabajo. Identifique las responsabilidades mediante la tabla 1 y, a continuación, reclute en consecuencia. Usa Azure Well-Architected Framework y su pilar de excelencia operativa para guiar tus responsabilidades de gestión de cargas de trabajo.

  4. Asignar responsabilidad. Nombre propietarios específicos para todas las responsabilidades de administración en la nube. En un modelo de administración compartida, los equipos de carga de trabajo deben tener autonomía para administrar sus suscripciones.

Documentar las operaciones en la nube

Documente claramente las operaciones en la nube para permitir una respuesta de crisis eficaz y una implementación fluida de los cambios. Establezca procedimientos generales y cree guías detalladas para tareas frecuentes y específicas.

Documentar procedimientos operativos

Defina procedimientos operativos para administrar las tareas de cambio, recuperación ante desastres y mantenimiento rutinario que la automatización no puede controlar. Siga estos pasos:

  1. Definir procedimientos de administración de cambios. El cambio es la causa principal del error en la nube. Desarrolle un proceso estandarizado para administrar los cambios para evitar errores en el entorno de nube. Consulte Administración del cambio.

  2. Definir procedimientos de implementación (administración de versiones). Para mantener una configuración coherente, normalice las implementaciones, las versiones y las promociones de entorno. Consulte Administración de implementaciones.

  3. Defina los procedimientos de recuperación ante desastres y continuidad empresarial. Para controlar posibles errores, prepare un plan de respuesta estandarizado. Consulte Administración de la recuperación ante desastres y la continuidad empresarial.

  4. Defina procedimientos adicionales. Documente los procesos para administrar solicitudes de servicio, aplicación de revisiones y administración de configuración. Documente claramente estos procesos para asegurarse de que las partes interesadas saben cómo iniciar o completar cada tarea.

Documentar guías operativas

Cree guías detalladas paso a paso (runbooks o manuales de estrategias) para tareas operativas clave. Esta preparación garantiza una ejecución coherente, mejora la eficacia y reduce los tiempos de resolución durante los eventos críticos.

  1. Definir tareas diarias. Prepare los manuales que cubren las responsabilidades diarias, como las solicitudes de escalación de privilegios y las revisiones de registros. Establezca procedimientos operativos estándar (SOP) para supervisar métricas, umbrales de alerta y paneles para cada sistema.

  2. Cree una biblioteca de runbooks centrados en Azure. Cree runbooks específicos de Azure para abordar escenarios como:

    Scenario Example
    Uso elevado de CPU Administración del escalado vertical en Azure App Service
    Conmutación por error y conmutación por recuperación Conmutación por error y conmutación por recuperación en Azure Site Recovery
    Implementaciones azules o verdes Implementación azul/verde en Azure Front Door
    Restauración de copia de seguridad Restauración de copia de seguridad en Azure Blob Storage y Azure Cosmos DB
  3. Almacene estos runbooks en un repositorio central. Mantenga los runbooks en un repositorio central accesible por los ingenieros de guardia para emplearlos inmediatamente durante los incidentes.

  4. Implemente operaciones mediante programación. Integre la infraestructura como código en los runbooks para implementar recursos comunes de forma coherente y precisa cada vez.

  5. Revisar y actualizar. Revise y revise periódicamente la documentación para reflejar los ajustes operativos y las actualizaciones del servicio en la nube.

Herramientas y soluciones de documentos

La documentación clara garantiza la coherencia, reduce los riesgos operativos y mejora la eficacia del equipo. Cree y mantenga una documentación completa para las herramientas en la nube. Actualice periódicamente la documentación para reflejar las prácticas actuales y garantizar una accesibilidad sencilla para todos los miembros del equipo.

Area Ventajas de ejemplo
Integration La estandarización simplifica las integraciones mediante la consolidación de registros y repositorios de código.
Automatización Reutilizar plantillas de IaC en distintos equipos, y scripts de automatización, y las mejores prácticas en todos los proyectos.
Administración de incidentes Capture problemas y genere acciones de corrección que se integren en ciclos de versión.

Administración de las operaciones en la nube

La administración en la nube eficaz optimiza la eficacia operativa, reduce el tiempo de inactividad y aclara los roles y las responsabilidades. Normalice las operaciones en la nube a través de procesos de automatización y soporte estructurado. Siga estas directrices operativas:

  • Proporcionar soporte continuo en la nube. Establezca la cobertura de soporte técnico 24/7 a través de equipos globales que adopten un modelo de seguimiento de husos horarios o guardias estructuradas. Defina claramente las responsabilidades para garantizar la respuesta oportuna y la resolución de incidentes críticos. Configure alertas automatizadas para notificar inmediatamente al personal de soporte técnico designado.

  • Automatizar el trabajo repetitivo. Use las funcionalidades de Automatización de Azure para minimizar los procesos manuales y reducir la sobrecarga operativa. Automatice las actividades rutinarias para eliminar errores, simplificar los flujos de trabajo y permitir que los equipos se centren en prioridades estratégicas.

    Caso de uso Examples
    Automatización Automatice los flujos de trabajo en Azure Boards o en el sistema ITSM. Plantillas para los elementos de trabajo de "Solicitud de Cambio" e "Incidente".
    Respuesta a los incidentes Para generar automáticamente tickets de incidentes con los campos estándar completados, integre Azure Monitor y Azure Service Health con el sistema de tickets.
    Administración de cambios Use Azure Logic Apps para aprobar automáticamente los cambios de bajo riesgo o corregir automáticamente determinados incidentes.
    Compliance Use Azure Policy para aplicar y supervisar el cumplimiento de la nube.
    Security Use Microsoft Defender for Cloud y Microsoft Sentinel para automatizar la detección y respuesta de amenazas de seguridad. Use la gobernanza de identificadores de Entra de Microsoft para revisar los permisos y automatizar la administración de permisos.

Mejora de las operaciones

Optimice el entorno de nube de Azure mediante la promoción de la mejora continua. Evalúe periódicamente las operaciones y priorice el aprendizaje y los comentarios continuos. Siga estos pasos:

  1. Revise las operaciones para mejorar. Siga los procedimientos recomendados para supervisar el estado, el cumplimiento, la seguridad, los costos, los datos y los recursos en la nube. Realice revisiones operativas semanales para analizar las métricas clave, los incidentes recientes, los cambios implementados y los riesgos previstos. Abordar activamente la expansión de recursos y la deuda técnica.

  2. Entrenamiento para operaciones. Fomentar el desarrollo continuo de aptitudes mediante la priorización de recursos de aprendizaje esenciales. Mantener operaciones dinámicas en la nube a través de entornos prácticos de entrenamiento. En la tabla siguiente se proporcionan recursos para el entrenamiento de operaciones.

    Entrenamiento de operaciones Description
    Obtener credenciales Establezca objetivos para las credenciales de Microsoft, como las aptitudes aplicadas y las certificaciones de Microsoft para crear conocimientos.
    Uso de recursos operativos Consulte Recursos de administración de Azure.
    Uso de la documentación del producto Use Microsoft Learn para encontrar instrucciones sobre los servicios de Azure.
    Obtener experiencia práctica Promover la práctica en entornos sandbox no productivos.

Recursos de administración de Azure

Categoría Recurso de gestión Description
Compliance Gobierno de CAF Marco de gobernanza en la nube de Microsoft
Security Administración de operaciones de seguridad Guía para administrar las operaciones de seguridad
Security Herramienta de seguridad de Microsoft Lista de herramientas de seguridad de Microsoft y Azure
Security Seguridad de la carga de trabajo Guía de carga de trabajo para la seguridad
Administración de recursos Estrategia de nomenclatura y etiquetado Recomendaciones de nomenclatura y etiquetado para administrar recursos
Administración de recursos Abreviatura de Azure Lista de abreviaturas para recursos de Azure
Administración de recursos Azure Advisor Asistente digital para alinearse con los procedimientos recomendados de Azure.
Administración de recursos Reglas de nomenclatura de Azure Reglas de nomenclatura para todos los recursos de Azure
Administración de recursos Guías de servicio de Azure Guía para las decisiones de configuración del servicio
Desarrollo Desarrollo de software de carga de trabajo Guía de carga de trabajo para el desarrollo de software
Desarrollo Centro de arquitectura de Azure Arquitecturas y guías para diferentes casos de uso
Desarrollo Centro de recursos para desarrolladores Un centro para herramientas y recursos para desarrolladores
Despliegue Bicep, Terraform y ARM templates Plantillas de IaC para cada recurso de Azure
Despliegue Pares de regiones de Azure Lista de regiones emparejadas de Azure
Despliegue Directorio de Azure Cloud Services Directorio de todos los servicios de Azure
Despliegue Implementación de cargas de trabajo Guía de carga de trabajo para la integración continua
Monitorización Supervisión del patrimonio de la nube de Azure Guía completa de supervisión de Azure
Monitorización Supervisión de cargas de trabajo Guía de carga de trabajo para la supervisión
Cost Administración de costos Guía de administración de costos
Cost Optimización de costos de carga de trabajo Guía de carga de trabajo para la optimización de costos
Reliability Administración de la confiabilidad de los datos Guía para mantener la confiabilidad de los datos
Reliability Administración de la confiabilidad de los recursos en la nube Guía para mantener la confiabilidad de los recursos
Reliability Administración de incidentes de seguridad Recomendaciones para responder a incidentes de seguridad
Performance Eficiencia del rendimiento de la carga de trabajo Guía de carga de trabajo para la eficiencia del rendimiento

Pasos siguientes