Delen via


Aanbevelingen voor het reageren op problemen met liveoptredens

Van toepassing op deze aanbeveling voor de controlelijst voor prestatie-efficiëntie van Power Platform Well-Architected Framework​:

PE:09 Reageer op problemen tijdens liveoptredens. Maak een plan hoe u prestatieproblemen kunt aanpakken door duidelijke communicatielijnen en verantwoordelijkheden in te bouwen. Wanneer zich een problematische situatie voordoet, kunt u wat u leert gebruiken om preventieve maatregelen te identificeren en deze in uw werklast op te nemen. Implementeer methoden om sneller terug te keren naar de normale bedrijfsvoering wanneer vergelijkbare situaties zich voordoen.

In deze handleiding worden de beste werkwijzen voor het oplossen van problemen tijdens liveoptredens beschreven. Live performance issues verwijzen naar real-time uitdagingen en knelpunten die de optimale werking van een workload kunnen belemmeren. Als deze problemen snel worden aangepakt, worden prestatieproblemen niet alleen direct opgemerkt en verholpen, maar wordt er ook voor gezorgd dat de werklast consistent aan de prestatienormen voldoet. Als u deze problemen niet aanpakt, kunnen er complicaties optreden, zoals vertragingen, crashes en systeemreacties. Ook kan de gebruikerservaring hierdoor verslechteren. Ze kunnen er ook voor zorgen dat gebruikers hun taken niet efficiënt kunnen uitvoeren, wat de reputatie van de organisatie schaadt.

Definities

Term Definitie
Gegevenscorrelatie Het op elkaar afstemmen van logboeken, statistieken en gebeurtenissen uit verschillende onderdelen van uw workload om onderliggende oorzaken te achterhalen.
Hoofdoorzaakanalyse Een proces voor het identificeren van de onderliggende factoren die verantwoordelijk zijn voor een probleem.
Zelfhelend De mogelijkheid om problemen automatisch te herstellen zonder menselijke tussenkomst.
Zelfpreventie Implementaties binnen een workload om potentiële problemen en fouten te voorkomen.

Belangrijke ontwerpstrategieën

Wanneer u een probleem ervaart tijdens een liveoptreden, dient u voorbereid te zijn en de juiste gegevens en een plan te hebben om het probleem aan te pakken. In dit plan moeten duidelijke communicatielijnen en verantwoordelijkheden worden vastgelegd. Het hoofddoel is om te bepalen of de prestatieproblemen tijdelijk of geïsoleerd zijn, om de hoofdoorzaak van het prestatieprobleem te achterhalen en om oplossingen te implementeren die een snelle terugkeer naar de normale werkzaamheden mogelijk maken en inzicht bieden in het incident. Het integreren van preventieve maatregelen in uw workflow is een cruciale strategie. Het doel is om te voorkomen dat hetzelfde probleem zich nogmaals voordoet of om de effecten ervan op de prestaties te beperken als het probleem niet te voorkomen is.

Bereid je voor op problemen

De ideale reactie op prestatieproblemen op een live-site is nauwkeurig en snel. Precisie en snelheid bij prestatieherstel vereisen voorbereiding. Om effectief te kunnen reageren op liveprestatieproblemen, is het essentieel om de belangrijkste prestatiegegevens in de gaten te houden, de hoofdoorzaak van de problemen te identificeren en passende oplossingen of optimalisaties te implementeren. Om deze stappen uit te voeren, moet u mogelijk werklastlogboeken analyseren, prestatie-tests uitvoeren en code of configuraties optimaliseren.

De volgende voorbeelden schetsen een aantal belangrijke voorbereidingsgebieden:

  • Zorg voor nauwkeurige architectuurdiagrammen. Uw architectuurdiagrammen moeten alle componenten bevatten en laten zien hoe ze met elkaar interacteren. Met een visuele weergave kunt u knelpunten en specifieke storingspunten identificeren die kunnen leiden tot prestatieverslechtering of onbeschikbaarheid. Idealiter spoort u deze problemen op en lost u ze op voordat ze problemen veroorzaken. Een actueel diagram kan u helpen problemen te identificeren in stressvolle momenten.

  • Controleer de gegevenstoegang. Gegevens en logboeken van bewakingsprocessen zijn van cruciaal belang om in realtime op prestatieproblemen te kunnen reageren en analyses van de grondoorzaak uit te kunnen voeren. Maar het is belangrijk om de integriteit en vertrouwelijkheid van de gegevens te behouden. Om te kunnen reageren op prestatieproblemen op een live-site is vaak toegang nodig tot onderliggende gegevens die normaal gesproken niet toegankelijk zijn. U moet ervoor zorgen dat medewerkers toegang hebben tot de gegevens die ze nodig hebben wanneer er problemen ontstaan. U dient echter alleen toegang te verlenen met een beperkte tijdsduur en minimale rechten, en u dient deze toegang te beperken tot geautoriseerd personeel.

  • Stel automatische waarschuwingen in. Met waarschuwingen kunt u problemen identificeren en aanpakken zodra ze zich voordoen. Waarschuwingen moeten meldingen genereren wanneer de werklastprestaties afwijken van de prestatiebasislijnen. Na verloop van tijd moet u de waarschuwingsconfiguratie aanpassen om te voorkomen dat er te veel of te weinig meldingen worden gegenereerd. De monitoringoplossingen die u gebruikt, moeten voldoende gegevens verzamelen om waarschuwingen te genereren. Deze waarschuwingen moeten aansluiten op de prestatiedoelen en vastgestelde basislijnen. Voorkom dat u waarschuwingen genereert over kwesties die niet relevant zijn voor uw doelen. Voorbeelden van waarschuwingen zijn onder meer afname van responstijden, prestaties van API-aanroepen of plug-ins en paginaladingen. Dataverse

Maak een triageplan

Het opstellen van een triageplan vereist het ontwikkelen van een gestructureerde aanpak voor het identificeren, escaleren, analyseren, prioriteren en communiceren van prestatieproblemen op de live-site. Een triageplan is een strategie voor het reageren op problemen tijdens liveoptredens. Hiermee wordt gewaarborgd dat prestatieverstoringen snel en effectief worden aangepakt, met duidelijke rollen en procedures. De meeste prestatieproblemen rechtvaardigen geen noodherstelprotocollen, maar ze kunnen de functionaliteit van de werklast zodanig beïnvloeden dat triageplanning noodzakelijk is. Een goed gedocumenteerd triageplan zorgt ervoor dat alle teamleden op één lijn zitten en snel kunnen handelen. Zo wordt de impact op gebruikers en werklasten tot een minimum beperkt. Een triageplan moet de volgende onderdelen bevatten:

  • Identificatie en monitoring: Implementeer een systeem om prestatieproblemen in realtime te identificeren en te monitoren. Zorg dat u een lijst heeft met de contactgegevens van mensen die beslissingen kunnen nemen of kwesties kunnen doorspelen naar hogere niveaus. Het plan moet ook de rollen en verantwoordelijkheden identificeren. Er moet worden vastgelegd welke accounts toegang krijgen tot beveiligde informatie en hoe lang.

  • Escalatieproces: Definieer een duidelijk escalatieproces om ervoor te zorgen dat prestatieproblemen tijdig worden geëscaleerd naar de juiste teams of personen. De procesdefinitie moet contactgegevens en richtlijnen voor het escaleren van problemen bevatten.

  • Grondoorzaakanalyse: Ontwikkel een proces voor het uitvoeren van een grondoorzaakanalyse om de onderliggende oorzaak van elk prestatieprobleem te identificeren. Het proces zou het analyseren van logboeken en prestatiegegevens moeten omvatten, evenals het uitvoeren van diagnostische tests om de oorzaak van elk probleem te achterhalen.

  • Prioritering: Stel een prioriteitenkader op om de ernst van prestatieproblemen te bepalen en deze te prioriteren op basis van hun effect op de werklast en gebruikers.

  • Communicatie: Maak een communicatieplan om belanghebbenden op de hoogte te houden van de status van prestatieproblemen en de voortgang van de oplossing ervan. Zorg voor regelmatige updates, statusrapporten en duidelijke communicatiekanalen.

  • documentatie: Documenteer het triageplan, inclusief alle stappen, processen en best practices. Deze documentatie moet eenvoudig toegankelijk zijn voor de teamleden die betrokken zijn bij het oplossen van prestatieproblemen.

Ontwikkel methoden om problemen te identificeren en op te lossen

Het oplossen van problemen met liveprestaties omvat het identificeren en aanpakken van factoren die prestatievermindering of inefficiëntie in een livewerklast kunnen veroorzaken. De gegevens die u tijdens monitoring verzamelt, zijn van onschatbare waarde voor het onderzoeken en oplossen van prestatiegerelateerde incidenten. Deze gegevens bieden een historisch overzicht van prestatiegegevens. Wanneer u over monitoringgegevens beschikt, kunt u de grondoorzaken analyseren en bijdragende factoren identificeren. U moet alle relevante controlegegevens gebruiken om elk prestatieprobleem te begrijpen en op te lossen. Houd bij hoeveel tijdelijke pieken u detecteert en pas de drempelwaarden indien nodig aan.

Gebruik een grondoorzaakanalyse

Voor het analyseren van de grondoorzaak is het testen van hypothesen nodig. Nadat u de bewakingsgegevens hebt beoordeeld, moet u de mogelijke oorzaken van het prestatieprobleem opsommen en testen.

Voer de volgende stappen uit om een grondoorzaakanalyse uit te voeren voor een probleem met een liveoptreden:

  • Verzamel informatie. Verzamel zoveel mogelijk informatie over het prestatieprobleem. Voorbeelden hiervan zijn foutmeldingen, logboeken, prestatiegegevens en andere relevante gegevens. Geef ook informatie over de gebruikers die het probleem hebben gemeld, zoals hun apparaat, netwerk en locatie.

  • Definieer het probleem. Definieer het probleem duidelijk door de symptomen en het effect dat het probleem heeft op de werklast of gebruikers te identificeren.

  • Onderzoek mogelijke oorzaken. Beperk de reikwijdte van de analyse door het specifieke onderdeel of gebied van de werklast te identificeren waar het prestatieprobleem zich voordoet. Identificeer mogelijke oorzaken van het prestatieprobleem op basis van de verzamelde informatie. Dit proces kan het analyseren van code, configuratie-instellingen, infrastructuur of externe afhankelijkheden omvatten.

  • Gegevens correleren. Duik dieper in de verzamelde gegevens om patronen, afwijkingen of correlaties te identificeren die kunnen bijdragen aan het prestatieprobleem. Gegevenscorrelatie is essentieel voor het identificeren van prestatieproblemen en de oorzaken daarvan. Dit kan het beoordelen van logboeken, analyseren van prestatiegegevens en uitvoeren van tests inhouden.

  • Test hypothesen. Formuleer hypothesen op basis van de mogelijke oorzaken die u identificeert. Voer testen uit om uw hypothesen te valideren of te weerleggen. Gebruik een testomgeving om te zien of u de fout kunt reproduceren.

  • Oplossingen implementeren. Zodra u de hoofdoorzaak hebt geïdentificeerd, ontwikkelt en implementeert u oplossingen om het prestatieprobleem aan te pakken.

  • Monitoren en valideren. Nadat u de oplossingen hebt geïmplementeerd, moet u de werklast voortdurend bewaken om er zeker van te zijn dat het prestatieprobleem is opgelost. Valideer de effectiviteit van de oplossingen door prestatiegegevens en gebruikersfeedback te monitoren.

Afweging: De stappen van een oorzaakanalyse, zoals het identificeren van mogelijke oorzaken, het testen van hypothesen en het documenteren van de analyse, kunnen tijdrovend zijn. Om prestatieproblemen met elkaar in verband te brengen, moet u ook gegevens verzamelen en opslaan. De benodigde tijd en infrastructuur kunnen aanzienlijke werklasten opleveren voor de operationele teams en kosten aan de werklast toevoegen.

Risico: Als u een root cause analyse uitvoert zonder de juiste beveiligingsmaatregelen, bestaat het risico dat u gevoelige informatie blootstelt wanneer u toegang verleent tot logs en gegevens.

Neem contact op met Microsoft Support

Neem contact op met Microsoft Support voor hulp bij aanhoudende prestatieproblemen. Medewerkers van Microsoft Support beschikken niet alleen over de expertise, hulpmiddelen, bronnen en ervaring om problemen op te lossen, maar zijn mogelijk ook op de hoogte van eventuele wereldwijde prestatieproblemen of storingen die van invloed kunnen zijn op uw werklast. Uw ondersteuningsovereenkomst bepaalt het niveau van de geleverde ondersteuning.

Vaak is het het beste om parallel met Microsoft Support te werken. Denk bijvoorbeeld aan een strategie waarbij sommige teamleden samenwerken met Microsoft Support, terwijl anderen doorgaan met het onderzoeken en oplossen van prestatieproblemen.

Het is belangrijk dat u de contactgegevens van de ondersteuning beschikbaar maakt voor het team. Houd er rekening mee dat Microsoft Support mogelijk ook toegang tot gegevens nodig heeft om effectief problemen op te kunnen lossen.

Zie Ondersteuning krijgen in Power Platform voor meer informatie.

Leer van bevindingen

Nadat u een prestatieprobleem met de livesite hebt opgelost, moet u bekijken wat er is gebeurd. Het doel is om van prestatieproblemen te leren, niet alleen om problemen te identificeren. De beste manier om te leren is via documentatie. Documenteer elk probleem en leg uit hoe u het kunt oplossen. Als een leverancier u geholpen heeft, werk dan samen met hem of haar om uw documentatie te verbeteren, uw team te trainen en uw werklast dienovereenkomstig aan te passen.

In de documentatie moet worden aangegeven hoe u kunt voorkomen dat het probleem zich opnieuw voordoet. Naast de documentatie kunt u verfijnde waarschuwingen maken, zodat u tijdig kunt reageren op prestatieprobleemindicatoren.

Power Platform-facilitering

Power Platform en Azure bieden verschillende hulpmiddelen waarmee u live prestatieproblemen kunt oplossen:

  • Azure Monitor is een uitgebreide bewakingsoplossing die inzicht biedt in de prestaties en de status van uw applicaties en infrastructuur. Azure Monitor biedt functies zoals metrische gegevens, logboeken, waarschuwingen en dashboards waarmee u prestatieproblemen kunt bewaken en diagnosticeren. Power Platform Apps en automatisering kunnen worden geïntegreerd met Azure Monitor dankzij de Application Insights mogelijkheid. Standaardtelemetrie en aangepaste traceringsgebeurtenissen kunnen worden gelogd en geanalyseerd.

  • Application Insights is een service voor applicatieprestatiebeheer (APM) waarmee ontwikkelaars en DevOps-professionals live-applicaties kunnen bewaken. Het detecteert automatisch prestatieafwijkingen, verzamelt logboeken en gebeurtenissen op applicatieniveau en biedt analysehulpmiddelen om problemen te diagnosticeren. Power Platform integreert met Application Insights.

  • Log Analytics is een service die loggegevens uit verschillende bronnen verzamelt en analyseert, waaronder applicaties, virtuele machines en Azure-resources. Wanneer u Log Analytics gebruikt, kunt u loggegevens opvragen en analyseren om inzicht te krijgen in de prestaties en het gedrag van uw toepassingen. Overweeg het gebruik van Log Analytics als uw workload Azure-resources gebruikt.

  • Solution Checker voert een uitgebreide statische analyse uit op uw oplossingen op basis van een reeks best-practiceregels en identificeert problematische patronen. Los eventuele prestatiegerelateerde problemen op voordat u de oplossing in productie neemt, om prestatieproblemen op de livesite te voorkomen.

Controlelijst voor prestatie-efficiëntie

Raadpleeg de volledige reeks aanbevelingen.