Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describe el apoyo a la fiabilidad en el entrenamiento comunitario. Abarca la resistencia regional con zonas de disponibilidad y recuperación ante desastres y continuidad empresarial. Para obtener información general más detallada sobre un principio de confiabilidad en Azure, consulte Confiabilidad de Azure.
Microsoft Community Training es una solución basada en la nube con tecnología de Azure que puede ofrecer programas de entrenamiento a gran escala y de gran difusión con alta calidad y eficacia mediante la implementación con redundancia de zona en regiones emparejadas. Gracias a Community Training, las organizaciones de todos los tamaños y tipos pueden llevar a cabo programas de formación a gran escala para sus comunidades internas y externas, con soporte para zonas de disponibilidad de planos de datos y control. Las comunidades pueden incluir trabajadores de primera línea, trabajadores extendidos, un ecosistema asociado, una red de voluntarios y beneficiarios del programa.
Soporte con zonas de disponibilidad
Las zonas de disponibilidad son grupos físicamente independientes de centros de datos dentro de una región de Azure. Cuando se produce un error en una zona, los servicios pueden conmutar por error a una de las zonas restantes.
Capacitación comunitaria usa las zonas de disponibilidad de Azure para proporcionar alta disponibilidad y tolerancia a errores en una región de Azure. Capacitación comunitaria ofrece compatibilidad con la zona de disponibilidad del plano de datos y el control:
El plano de control tiene redundancia de zona en las regiones primarias de disponibilidad.
El plano de datos puede ser zonal o con redundancia de zona, en función de lo que elija para sus necesidades. Sin embargo, se recomienda encarecidamente elegir una implementación con redundancia de zona para evitar la pérdida de datos y mantener la disponibilidad del servicio durante una interrupción de zona.
Requisitos previos
Las zonas de disponibilidad son compatibles con las siguientes SKU de aprendizaje de la comunidad:
- Estándar (menor escala de usuarios)
- Premium (gran escala de usuarios)
Community Trainning solo es compatible en regiones emparejadas. Cada región secundaria se implementa con una configuración zonal. La siguiente tabla muestra todas las regiones que admiten zonas de disponibilidad para Capacitación comunitaria, junto con su región emparejada.
| Región primaria | Región emparejada |
|---|---|
| UKSouth | UKWest |
| AustraliaEast | AustraliaSoutheast |
| EastUS | WestUS |
| EastUS2 | CentralUS |
| NorthEurope | WestEurope |
| WestUS3 | EastUS |
| SueciaCentral | Sur de Suecia |
Soporte con la conmutación por error zonal
Capacitación comunitaria usa muchos servicios de Azure de dependencia, como App Service y Azure SQL. Al elegir una implementación con redundancia de zona, Community Training también crea ofertas con redundancia zonal de esos recursos de servicio de Azure subyacentes. Si se produce un error en una zona, todos los recursos, incluidos los recursos de dependencia, conmutan por error a una de las zonas correctas.
Creación de un recurso con la zona de disponibilidad habilitada
Capacitación comunitaria proporciona configuración para zonas de disponibilidad solo en el momento de la creación de la instancia. Si desea cambiar la configuración de la zona de disponibilidad después de la creación de la instancia, deberá crear una nueva instancia.
Experiencia a nivel de zona
Zonal. Durante una interrupción del servicio en toda la zona, Capacitación comunitaria puede sufrir una interrupción total o parcial del servicio. El grado de disponibilidad depende de varios factores, como si todo el centro de datos está inactivo o si un servicio de dependencia específico ya no está disponible en esa zona.
Redundancia de zona. Durante una interrupción en toda la zona, no debería experimentar ningún impacto en los recursos aprovisionados. Sin embargo, debe estar preparado para una breve interrupción en la comunicación con esos recursos. En una situación de bajada de zona, los clientes suelen recibir códigos de error 409, así como los intentos de lógica de reintento para volver a establecer conexiones a intervalos adecuados. Las nuevas solicitudes se dirigen a nodos correctos con un impacto cero en el usuario. Durante las interrupciones de toda la zona, los usuarios pueden crear nuevos recursos y escalar correctamente los existentes.
Recuperación ante desastres y continuidad empresarial
La recuperación ante desastres (DR) hace referencia a las prácticas que las organizaciones usan para recuperarse de eventos de alto impacto, como desastres naturales o implementaciones con errores que producen tiempo de inactividad y pérdida de datos. Independientemente de la causa, el mejor remedio para un desastre es un plan de recuperación ante desastres bien definido y probado y un diseño de aplicación que admita activamente la recuperación ante desastres. Antes de empezar a crear el plan de recuperación ante desastres, consulte Recomendaciones para diseñar una estrategia de recuperación ante desastres.
Para la recuperación ante desastres, Microsoft usa el modelo de responsabilidad compartida. En este modelo, Microsoft garantiza que la infraestructura de línea base y los servicios de plataforma estén disponibles. Sin embargo, muchos servicios de Azure no replican automáticamente datos ni se revierten de una región con errores para realizar la replicación cruzada en otra región habilitada. Para esos servicios, es responsable de configurar un plan de recuperación ante desastres que funcione para la carga de trabajo. La mayoría de los servicios que se ejecutan en ofertas de plataforma como servicio (PaaS) de Azure proporcionan características e instrucciones para admitir la recuperación ante desastres. Puede usar características específicas del servicio para admitir la recuperación rápida con el fin de contribuir al desarrollo del plan de recuperación ante desastres.
El equipo de Microsoft Community Training administra todo el procedimiento de recuperación ante desastres para Capacitación comunitaria. La recuperación ante desastres no es activa-activa o pasiva activa, pero se basa en la recuperación de la copia de seguridad disponible más reciente de los servicios de Azure. El equipo de Capacitación comunitaria crea manualmente todos los recursos en la región emparejada a partir de la copia de seguridad de datos.
Nota
La recuperación ante desastres de Capacitación comunitaria solo es compatible en regiones emparejadas.
Recuperación ante desastres en la geografía de varias regiones
En un desastre regional, el plano de control se conmuta manualmente por error a la región emparejada. Debe esperar alguna degradación del servicio en el tiempo antes de que se complete la conmutación por error. Después de la conmutación por error, solo se admiten las operaciones de solo lectura hasta que la región de desastre vuelva a estar en línea. El servicio se conmuta manualmente por recuperación a la región original una vez que vuelve a estar en línea y se reanudan todas las operaciones. Se espera que el objetivo de punto de recuperación (RPO) sea de 10 minutos; Objetivo de tiempo de recuperación (RTO), 24 horas.
Para el plano de datos, Capacitación comunitaria ofrece recuperación ante desastres administrada por Microsoft. Para usar la recuperación ante desastres administrada, debe habilitar la recuperación ante desastres durante la creación de la instancia de Capacitación comunitaria en Azure. Una vez que habilite la recuperación ante desastres, Microsoft mantiene la copia de seguridad del almacenamiento y la base de datos en la región emparejada. Se espera que el objetivo de punto de recuperación (RPO) sea de 12 horas; Objetivo de tiempo de recuperación (RTO), 48 horas.
Nota
RTO depende del tamaño de la base de datos y del almacenamiento, y de la latencia entre las regiones emparejadas. Capacidad de la máquina virtual de almacenamiento o base de datos (SKU). El RPO depende de los recursos subyacentes de Azure, como Azure SQL y Azure Storage. Para obtener más información sobre RTO y RPO, consulte ¿Qué son la continuidad empresarial, la alta disponibilidad y la recuperación ante desastres?.
Detección, notificación y administración de interrupciones
Cuando una verificación de estado de Capacitación comunitaria detecta una interrupción de cualquier servicio y en cualquier región, Microsoft solicita su consentimiento para la conmutación por error a la región emparejada. Microsoft le informa de qué características están disponibles durante el procedimiento de recuperación ante desastres. Una vez que Microsoft reciba su consentimiento, el equipo de Community Training podrá iniciar el procedimiento de recuperación ante desastres.
Importante
Los alumnos no podrán consumir características de audio y vídeo hasta que la región primaria esté operativa. Se recomienda evitar operaciones de carga de medios hasta que el sitio primario esté operativo.
Capacidad y resistencia proactiva de la recuperación ante desastres
Microsoft y sus clientes operan bajo el modelo de responsabilidad compartida. Una vez que cualquier región está inactiva, no solo es la instancia de Capacitación comunitaria migrada a la región emparejada, sino también todas las cargas de trabajo de productos y clientes también se migran a la región emparejada. Este procedimiento puede provocar una escasez de recursos en la región emparejada o el centro de datos. Como resultado, la disponibilidad de la recuperación ante desastres depende de la capacidad disponible de los recursos subyacentes de Azure.