Exploración de las operaciones continuas

Completado

Las operaciones continuas son una de las ocho funcionalidades de la taxonomía de DevOps.

Descubra por qué es necesario realizar operaciones continuas

Los sistemas complejos sufren errores y pueden provocar costosas interrupciones. Veamos algunos ejemplos.

Empresas Evento
Icono para el problema que afecta a Delta Airlines
Líneas aéreas delta
En agosto de 2016, Delta se vio obligado a cancelar 2.300 vuelos cuando una sola pieza de equipo con mal funcionamiento provocó una interrupción de energía en su centro de operaciones en Atlanta. El costo notificado a la empresa era de 150 millones de dólares.
Icono para el problema que afecta a FedEx
FedEx y servicio nacional de salud del Reino Unido
En mayo de 2017, WannaCry ransomware causó interrupciones operativas en FedEx. Una subsidiaria de FedEx reportó 300 millones de dólares en pérdidas. El Servicio Nacional de Salud del Reino Unido era otra víctima del ransomware, que bloqueaba el acceso a sus ordenadores, bloqueaba el equipo médico vital y obligaba a algunos hospitales a desviar ambulancias a otras ubicaciones.
Icono para el problema que afecta a Amazon S3
Amazon S3
En febrero de 2017, el error del operador provocó una interrupción de cuatro horas en los servicios de almacenamiento principales de Amazon, lo que tuvo varios impactos en propiedades web significativas, como Alexa, IFTTT, Quora y Trello.
Icono de problema que afecta a LinkedIn
LinkedIn
LinkedIn experimentó un problema que impedía que el trabajo de desarrollo se realizara durante dos meses.
Icono para el problema que afecta a Equifax
Equifax
Equifax experimentó una infracción en 2017, lo que dio lugar a que se expondía la información personal de más de 160 millones de consumidores. Lo analizamos con más detalle en Seguridad continua.

El impacto empresarial y el costo de una infracción

Los costos de una vulneración de seguridad suelen ir más allá de la pérdida de ventas y confianza en una empresa. Estos costos pueden incluir:

  • Notificación de & de respuesta
    • Existen costos operativos y de servicio para notificar a las partes afectadas según lo requiera la ley. Estos costos suelen incluir costos adicionales para los centros de llamadas, el soporte técnico de pr y los servicios de supervisión de crédito.
  • Pérdida de productividad y rotación de empleados
    • El consejero general de Yahoo renunció, y el CEO no recibió una bonificación anual por 2016.
  • Demandas y acuerdos
    • El objetivo pagó $18,5 millones a 47 estados estadounidenses.
  • Multas y respuestas normativas
    • Con las nuevas políticas de protección de datos vigentes en la Unión Europea desde 2018, la multa es 4% de ingresos anuales o 20 millones de euros, lo que sea mayor.
  • Costos de recuperación de marca
    • La firma de tecnología minera Codan vio que los ingresos bajaron de $45 millones a $9,2 millones dentro de un año.
  • Otros pasivos
    • Verizon pagó $350 millones menos por Yahoo después de dos ataques masivos.

Es posible que también sean necesarios requisitos de seguridad y auditoría adicionales.

Disponibilidad y recuperación en operaciones continuas

Según una encuesta de Gartner, los líderes empresariales y de TI esperan que unos 47% de aplicaciones de producción se ejecuten en ubicaciones de nube pública en 2020.

Cuando se pueden destruir centros de datos completos con una línea de código,&líderes del sistema operativo se centran en la disponibilidad y recuperación de los entornos de producción deben cambiar. Los nuevos patrones de implementación cambian la forma en que garantizamos las funcionalidades de disponibilidad y recuperación de la aplicación y de la infraestructura.

El diagrama muestra las operaciones continuas que admiten la disponibilidad, la resiliencia, la recuperación y la confiabilidad. Detectamos problemas, los evaluamos, actuamos sobre ellos y aprendemos de nuestras acciones. El ciclo cuenta con el apoyo de personas y tecnología.

Número creciente de aplicaciones y versiones en producción

Los indicadores clave de rendimiento para el rendimiento de entrega de software son:

  • Plazo del cambio
  • Frecuencia de implementación
  • Tiempo medio para restaurar
  • Tasa de error de cambio

Los equipos que trabajan para aumentar la velocidad, pero que no invierten lo suficiente en la creación de calidad en el proceso experimentarán errores más grandes y más tiempo para restaurar el servicio. Los equipos que crean calidad en el proceso logran la velocidad y la estabilidad.

El número de aplicaciones web y móviles, y la frecuencia de las versiones de aplicaciones ha aumentado considerablemente. El código también se ha vuelto cada vez más complejo.

Diagrama que muestra el número de aplicaciones y la frecuencia de lanzamiento aumentaron de 2010 a 2020.

Nota:

Una gran parte del valor de DevOps en general consiste en encontrar el equilibrio adecuado entre la innovación (velocidad) y la continuidad empresarial (control).

¿Qué es operaciones continuas?

Importante

Las operaciones continuas reducen o eliminan la necesidad de tiempos de inactividad o interrupciones planeados, como el mantenimiento programado. La supervisión continua de la infraestructura, las aplicaciones y los servicios debe estar vinculado a la corrección automatizada si es posible. Un usuario nunca debe saber cuándo se produce una actualización o una versión incremental.

El diagrama muestra cómo AIOps y el monitoreo de la experiencia digital, la orquestación del lanzamiento de aplicaciones y el monitoreo basado en el tiempo de actividad respaldan la información sobre la experiencia del cliente, la implementación rápida de aplicaciones, la escalabilidad dinámica y las estrategias centradas en la nube.

Comparación de las prácticas tradicionales y de operación continua

En un modelo empresarial tradicional, TI aplica lo que se publica y controla a todos los usuarios con procesos y procedimientos rígidos.

Este enfoque provoca una desalineación entre los equipos de desarrollo y la gobernanza de TI. Los equipos de desarrollo son principalmente ágiles, centrados en la velocidad y esperan liberarse con tanta frecuencia como deseen. Para ellos, la gobernanza de TI parece ser un cuello de botella que no está alineado con los objetivos esperados de tiempo de mercado de las necesidades empresariales actuales.

Diagrama que muestra la desalineación entre los equipos de desarrollo y la gobernanza de TI. Los equipos de desarrollo se centran en la velocidad a través del autoservicio, el acceso a producción y las versiones rápidas. La gobernanza se centra en el control a través de directivas, seguridad y administración de costos.

Importante

Cuando se implementa correctamente, DevOps puede ofrecer innovación (velocidad) y continuidad empresarial (control).

En un ciclo de vida de desarrollo tradicional:

  • Las pruebas se realizan justo antes de pasar a vivir.
  • La supervisión suele entregarse.
  • La seguridad suele consultarse en las fases de prueba.
  • Durante la entrega, se deben realizar comprobaciones de seguridad del código y todos los controles de administración de servicios.
  • El cumplimiento no suele formar parte de la entrega, sino algo que "aparece" durante el estado operativo de un servicio.
  • La planeación de resistencia y continuidad se realiza como parte de la fase de diseño, pero las pruebas reales de escenarios relacionados a menudo solo se realizan durante las operaciones o fases de prueba, lo que puede dar lugar a cambios de configuración, reprocesamiento y esfuerzo de desperdiciado.
  • La colaboración entre las operaciones, la seguridad & el cumplimiento y los desarrolladores a menudo se realizan de forma reactiva a través de procesos de administración de incidentes y administración de problemas.
  • Dejar la automatización hasta que las fases finales a menudo dejan pocos recursos para hacerlo.

Diagrama que muestra el ciclo de vida de desarrollo tradicional.

Los nuevos métodos, tecnologías y formas de trabajar requieren un nuevo enfoque para las operaciones continuas. Han surgido las ocho principales prácticas de operaciones continuas y continúan evolucionando:

  • La seguridad y el cumplimiento por diseño reconocen que ciertos estándares, legislación, pero también requisitos empresariales, como la rastreabilidad y la auditoría, deben tenerse en cuenta en tiempo de diseño al diseñar entornos de nube altamente automatizados.
  • La continuidad y la resistencia requieren una estrecha colaboración con la organización para garantizar que las necesidades empresariales se reflejen en el diseño y la implementación.
  • de supervisión de telemetría & se puede usar para detectar patrones de uso de clientes, posibles nuevas necesidades e información detallada sobre dónde encuentran los usuarios errores. Estas herramientas también pueden ayudar a garantizar que se entregue el valor.
  • Administración de servicios es una conversación diferente en una cultura DevOps:
    • Desplazarse hacia significa que lo posees. Se compila, se ejecuta y, cuando se interrumpe, se corrige.
    • Céntrese en lo que es necesario.
    • Capacite la gobernanza.
    • Facilitar la transparencia.
  • La cultura y la colaboración son esenciales para las operaciones continuas. Las organizaciones suelen ser necesarias para cambiar la forma en que trabajan para facilitar la transformación hacia los equipos de DevOps. La colaboración también es esencial al diseñar para la seguridad y la resistencia.
  • Automation & AI/ML Ops son aspectos importantes de lo que hace que DevOps (y la nube) sea diferente en comparación con los equipos de operaciones tradicionales. El enfoque debe estar en todo el sistema que se está automatizando (automatización sistémica) y no solo en un área.
  • La implementación continua usa canalizaciones de versión modernas para permitir que los equipos de desarrollo implementen nuevas características de forma rápida y segura, lo que permite un flujo continuo de valor de cliente y reduce el tiempo para corregir los problemas.
  • Las pruebas de desplazamiento a la derecha usan procedimientos como el inicio oscuro, las marcas de características, la supervisión y las pruebas A/B. Después, Teams puede seguir probando para asegurarse de que una aplicación cumple las expectativas de comportamiento, rendimiento y disponibilidad durante el uso en directo.

Diagrama que muestra cómo realizar operaciones continuas. Debe aplicar un cambio de paradigma y usar los principios de operaciones continuas de DevOps.

Para evolucionar a un enfoque de DevOps, debe producirse un cambio de paradigma importante en la cultura a fin de ofrecer valor empresarial con un enfoque de TI moderna.

de TI tradicional de TI moderna
ADN Intermediación Eliminación de la intermediación
Entrega de servicios Basado en oleadas Iteración continua basada en iteración
de estabilidad del servicio Diseño para éxito (alta disponibilidad/redundancia) Diseño para errores (resistente)
Niveles de delegación Silos de TI Servicios de un extremo a otro
Procesos En documentos, optimizados y rediseñados Autoservicio, conocimiento, baja fricción, automatizado
Automatización Aislado, iniciado manualmente Sistémico, desencadenado, automático
Monitorización Elemento, centrado en errores Servicio, funcionalidad de un extremo a otro centrado
Apoyo Service Desk/Contact Center Atención al cliente/Autoservicio
Ciclo de vida N-1 o versiones anteriores N, N+1
Configuración/Administración de activos Configuración detectada o manual Prescrito, declarativo, automatizado

Estos cambios dan lugar a procesos simplificados y automatizados, incentivos de resultados alineados, riesgo reducido y enfoque centrado en el cliente.