Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Se aplica a esta recomendación de lista de comprobación de eficiencia del rendimiento de buena arquitectura de Power Platform:
| PE:09 | Responder a problemas de performance en vivo. Planifique cómo abordar los problemas de desempeño incorporando líneas claras de comunicación y responsabilidades. Cuando se presente una situación problemática, utiliza lo aprendido para identificar medidas preventivas e incorporarlas a tu carga de trabajo. Implementar métodos para volver a las operaciones normales más rápidamente cuando ocurran situaciones similares. |
|---|
Esta guía describe las mejores prácticas para responder a problemas de presentaciones en vivo. Los problemas de rendimiento en vivo se refieren a desafíos y cuellos de botella en tiempo real que pueden obstaculizar el funcionamiento óptimo de una carga de trabajo. Abordar estos problemas rápidamente no solo facilita la detección y rectificación inmediata de problemas de rendimiento, sino que también garantiza que la carga de trabajo cumpla consistentemente con sus parámetros de rendimiento. No abordarlos puede generar complicaciones, incluidas ralentizaciones, bloqueos y falta de respuesta del sistema, además de degradar la experiencia del usuario. También pueden impedir que los usuarios completen sus tareas de manera eficiente y, a su vez, empañar la reputación de la organización.
Definiciones
| Término | Definición |
|---|---|
| Correlación de datos | Alinear registros, métricas y eventos de varias partes de su carga de trabajo para identificar las causas subyacentes. |
| Análisis de la causa raíz | Un proceso para identificar los factores subyacentes que son responsables de un problema. |
| Autosanación | La capacidad de reparar problemas automáticamente sin intervención humana. |
| Autoprevención | Implementaciones dentro de una carga de trabajo para prevenir posibles problemas y fallas. |
Estrategias clave de diseño
Cuando experimenta un problema durante una presentación en vivo, debe estar preparado con los datos correctos y un plan para responder al problema. Este plan debe incluir líneas claras de comunicación y responsabilidades. El objetivo principal es identificar si los problemas de rendimiento son temporales o aislados, identificar la causa raíz del problema de rendimiento e implementar soluciones que faciliten un rápido retorno a las operaciones normales y brinden información sobre el incidente. Integrar medidas preventivas en su flujo de trabajo es una estrategia fundamental. El objetivo es evitar que el mismo problema vuelva a ocurrir o reducir sus efectos en el rendimiento si no se puede prevenir.
Prepárese para los problemas
La respuesta ideal a los problemas de rendimiento del sitio en vivo es precisa y rápida. La precisión y la velocidad en la remediación del rendimiento requieren preparación. Para responder eficazmente a los problemas de rendimiento en vivo, es fundamental monitorear las métricas de rendimiento clave, identificar la causa raíz de los problemas e implementar soluciones u optimizaciones adecuadas. Para realizar estos pasos, es posible que necesite analizar registros de carga de trabajo, realizar pruebas de rendimiento y optimizar el código o las configuraciones.
Los siguientes ejemplos describen algunas áreas críticas de preparación:
Tener diagramas de arquitectura precisos. Los diagramas de arquitectura deben incluir todos los componentes y mostrar cómo interactúan. La representación visual puede ayudar a identificar cuellos de botella y puntos únicos de falla que pueden provocar degradación del rendimiento o falta de disponibilidad. Lo ideal es detectar y eliminar estos problemas antes de que causen inconvenientes, pero tener un diagrama actualizado puede ayudarle a identificar los problemas en momentos de mucho estrés.
Comprobar el acceso a los datos. Los datos y registros de los procesos de monitoreo son fundamentales para responder a los problemas de rendimiento en tiempo real y realizar análisis de causa raíz. Pero es importante mantener la integridad y confidencialidad de los datos. Para responder a problemas de rendimiento del sitio en vivo a menudo es necesario acceder a datos subyacentes a los que normalmente no se podría acceder. Debe asegurarse de que el personal tenga acceso a los datos que necesita cuando surgen problemas. Pero sólo debe conceder acceso con restricciones de tiempo y privilegios mínimos, y debe limitar ese acceso al personal autorizado.
Establecer alertas automáticas. Las alertas pueden ayudarle a identificar y abordar problemas tan pronto como ocurren. Las alertas deben generar notificaciones cuando el rendimiento de la carga de trabajo se desvía de los valores de referencia de rendimiento. Con el tiempo, deberás ajustar las configuraciones de alertas para evitar generar demasiadas o muy pocas notificaciones. Las soluciones de monitoreo que utiliza necesitan recopilar suficientes datos para generar alertas. Estas alertas deben estar alineadas con los objetivos de rendimiento y las líneas de base establecidas. Debes evitar generar alertas sobre temas que no sean relevantes para tus objetivos. Los ejemplos de alertas incluyen degradaciones en los tiempos de respuesta, el rendimiento de las llamadas API o los complementos y las cargas de páginas. Dataverse
Crear un plan de triaje
La creación de un plan de clasificación implica diseñar un enfoque estructurado para identificar, escalar, analizar, priorizar y comunicar problemas de rendimiento en el sitio en vivo. Un plan de triaje es una estrategia para responder a problemas durante el desempeño en vivo. Garantiza que las interrupciones del rendimiento se aborden con rapidez y eficacia, con roles y procedimientos claros. La mayoría de los problemas de rendimiento no ameritan protocolos de recuperación ante desastres, pero pueden afectar la funcionalidad de la carga de trabajo lo suficiente como para requerir una planificación de triaje. Un plan de clasificación bien documentado garantiza que todos los miembros del equipo estén alineados y puedan actuar con rapidez, minimizando el impacto en los usuarios y las cargas de trabajo. Un plan de triaje debe incluir los siguientes componentes:
Identificación y seguimiento: Implementar un sistema para identificar y monitorear problemas de desempeño en tiempo real. Debe tener una lista con la información de contacto de personas capaces de tomar decisiones o escalar problemas a niveles superiores. El plan también debe identificar roles y responsabilidades. Debe documentar qué cuentas obtienen acceso a información protegida y durante cuánto tiempo.
Proceso de escalamiento: Defina un proceso de escalamiento claro para garantizar que los problemas de desempeño se transmitan a los equipos o individuos adecuados de manera oportuna. La definición del proceso debe incluir información de contacto y pautas para escalar problemas.
Análisis de causa raíz: Desarrollar un proceso para realizar un análisis de causa raíz para identificar la causa subyacente de cada problema de desempeño. El proceso debe implicar el análisis de registros y métricas de rendimiento y la realización de pruebas de diagnóstico para identificar el origen de cada problema.
Priorización: establecer un marco de priorización para determinar la gravedad de los problemas de rendimiento y priorizarlos en función de su efecto sobre la carga de trabajo y los usuarios.
Comunicación: Cree un plan de comunicación para mantener a las partes interesadas informadas sobre el estado de los problemas de desempeño y el progreso de su resolución. Considere actualizaciones periódicas, informes de estado y canales de comunicación claros.
Documentación: Documente el plan de triaje, incluidos todos sus pasos, procesos y mejores prácticas. Esta documentación debe ser de fácil acceso para los miembros del equipo que participan en la respuesta a problemas de rendimiento.
Desarrollar métodos para identificar y resolver problemas.
Para resolver problemas de rendimiento en vivo es necesario identificar y abordar cualquier factor que pueda provocar degradación del rendimiento o ineficiencias en una carga de trabajo en vivo. Los datos que recopila durante la supervisión son invaluables para investigar y resolver incidentes relacionados con el rendimiento. Estos datos proporcionan un registro histórico de las métricas de rendimiento. Cuando dispone de datos de seguimiento, puede analizar las causas fundamentales e identificar los factores que contribuyen. Debe utilizar todos los datos de monitoreo relevantes para comprender y solucionar cada problema de rendimiento. Monitorea cuántos picos transitorios estás detectando y ajusta los umbrales en consecuencia.
Utilice el análisis de causa raíz
El análisis de causa raíz requiere prueba de hipótesis. Después de revisar los datos de monitoreo, debe enumerar las posibles causas del problema de rendimiento y probarlas.
Para realizar un análisis de causa raíz de un problema de presentación en vivo, siga estos pasos:
Deducir la información. Recopile tanta información como sea posible sobre el problema de rendimiento. Los ejemplos incluyen mensajes de error, registros, métricas de rendimiento y cualquier otro dato relevante. Incluya también información sobre los usuarios que informaron el problema, como su dispositivo, red y ubicación.
Definir el problema. Defina claramente el problema identificando los síntomas y el efecto que el problema tiene sobre la carga de trabajo o los usuarios.
Investigar las posibles causas. Limite el alcance del análisis identificando el componente o área específica de la carga de trabajo donde ocurre el problema de rendimiento. Identifique las posibles causas del problema de rendimiento basándose en la información recopilada. Este proceso puede implicar el análisis de código, configuración, infraestructura o dependencias externas.
Correlacionar datos. Profundice en los datos recopilados para identificar patrones, anomalías o correlaciones que puedan contribuir al problema de rendimiento. La correlación de datos es clave para identificar problemas de rendimiento y sus causas. Puede implicar revisar registros, analizar métricas de rendimiento y realizar pruebas.
Probar hipótesis. Formula hipótesis basadas en las posibles causas que identifiques. Realizar pruebas para validar o refutar sus hipótesis. Deberías utilizar un entorno de prueba para ver si puedes replicar el error.
Implementar soluciones. Una vez que identifique una causa raíz, desarrolle e implemente soluciones para abordar el problema de rendimiento.
Monitorizar y validar. Después de implementar las soluciones, supervise continuamente la carga de trabajo para asegurarse de que se resuelva el problema de rendimiento. Validar la efectividad de las soluciones monitoreando las métricas de desempeño y los comentarios de los usuarios.
Compensación: Los pasos de un análisis de causa raíz, como identificar las posibles causas, probar hipótesis y documentar el análisis, pueden llevar mucho tiempo. Para correlacionar problemas de rendimiento, también es necesario recopilar y almacenar datos. El tiempo y la infraestructura necesarios pueden agregar trabajo significativo a los equipos de operaciones y costos a la carga de trabajo.
Riesgo: Si realiza un análisis de causa raíz sin las medidas de seguridad adecuadas, existe el riesgo de exponer información confidencial al proporcionar acceso a registros y datos.
Contacte con el soporte técnico de Microsoft
Comuníquese con el soporte técnico de Microsoft para obtener ayuda para resolver problemas de rendimiento persistentes. ... Los representantes de soporte técnico de Microsoft no solo tienen los conocimientos, las herramientas, los recursos y la experiencia para resolver problemas, sino que también pueden estar al tanto de cualquier problema o interrupción de rendimiento global actual que pueda afectar su carga de trabajo. Su acuerdo de soporte determina el nivel de soporte proporcionado.
A menudo es mejor trabajar en paralelo con el soporte técnico de Microsoft. Por ejemplo, considere una estrategia en la que algunos miembros del equipo colaboran con el soporte técnico de Microsoft, mientras otros continúan clasificando y solucionando problemas de rendimiento.
Es importante que la información de contacto de soporte esté disponible para el equipo. Tenga en cuenta que el soporte técnico de Microsoft también podría necesitar acceso a los datos para participar eficazmente en la resolución de problemas.
Para obtener más información, consulte Obtener soporte técnico en Power Platform.
Aprender de los hallazgos
Después de solucionar un problema de rendimiento del sitio en vivo, debes revisar lo que sucedió. El objetivo es aprender de los problemas de desempeño, no sólo identificarlos. La mejor manera de aprender es a través de la documentación. Documente cada problema y explique cómo solucionarlo. Si un proveedor le ayudó, trabaje con él para mejorar su documentación, capacitar a su equipo y modificar su carga de trabajo en consecuencia.
La documentación debe indicar cómo evitar que cada problema vuelva a ocurrir. Junto con la documentación, puede crear alertas refinadas que lo ayuden a responder tempranamente a los indicadores de problemas de rendimiento.
Facilitación de Power Platform
Power Platform y Azure proporcionan varias herramientas para ayudarlo a responder a problemas de rendimiento en vivo:
Azure Monitor es una solución de supervisión integral que proporciona información sobre el rendimiento y el estado de sus aplicaciones e infraestructura. Azure Monitor ofrece características como métricas, registros, alertas y paneles para ayudarlo a supervisar y diagnosticar problemas de rendimiento. Power Platform Las aplicaciones y la automatización se pueden integrar con Azure Monitor mediante la capacidad Application Insights . Se pueden registrar y analizarla telemetría estándar junto con eventos de seguimiento personalizados.
Application Insights es un servicio de gestión del rendimiento de aplicaciones (APM) que ayuda a los desarrolladores y profesionales de DevOps a supervisar aplicaciones en vivo. Detecta automáticamente anomalías de rendimiento, recopila registros y eventos a nivel de aplicación y proporciona herramientas de análisis para diagnosticar problemas. Power Platform Se integra con Application Insights.
Log Analytics es un servicio que recopila y analiza datos de registro de diversas fuentes, incluidas aplicaciones, máquinas virtuales y recursos de Azure. Cuando utiliza Log Analytics, puede consultar y analizar datos de registro para obtener información sobre el rendimiento y el comportamiento de sus aplicaciones. Considere usar Log Analytics si su carga de trabajo utiliza recursos de Azure.
Solution Checker realiza un análisis estático exhaustivo de sus soluciones comparándolas con un conjunto de reglas de mejores prácticas e identifica patrones problemáticos. Aborde cualquier problema relacionado con el rendimiento antes de implementar la solución en producción para evitar problemas de rendimiento en el sitio en vivo.
Lista de comprobación de eficiencia en el rendimiento
Consulte el conjunto completo de recomendaciones.