Freigeben über


Best Practices zur Verbesserung der Leistung von konversationellen Agenten

Vermeiden Sie Leistungsprobleme bei konversationellen Agenten, indem Sie häufige Fehlerpunkte verstehen und Best Practices befolgen.

Kontingente und Grenzwerte

Verstehen Sie Quoten und Grenzen, wie RPM (Anfrage pro Minute, bei der die Anfrage eine Nachricht an einen Agenten ist) und die Anzahl der erlaubten Power Platform-Anfragen innerhalb eines 24-Stunden-Zeitraums.

Für Ihre Agenten gelten Quoten sowie die Kapazitätsbeschränkungen, die mit einem Microsoft Copilot Studio-Plan einhergehen.

Optimieren Sie Ihren Agenten auf Leistung

Um Ihren Makler auf Leistung zu optimieren, sollten Sie die folgenden Best Practices berücksichtigen:

  • Platziere API-Aufrufe und Connector-Aufrufe strategisch in deinen Gesprächsabläufen, um zu vermeiden, dass Nutzer auf mehrere Abschlüsse warten.
  • Wo anwendbar, wurde Informationen mithilfe von Variablen abgerufen, anstatt mehrere API-Aufrufe oder Flow-Aufrufe durchzuführen.
  • Cloud-Flows, die von Copilot Studio-Agenten aufgerufen werden, können Latenz verursachen. Erwägen Sie stattdessen die Verwendung von Direct Connector-Calls oder dem Send HTTP Request-Knoten .
  • Verstehen Sie den Leistungs- und Komplexitätskompromiss von Classic NLU und generativer Orchestrierung in Copilot Studio. NLU-Modelle funktionieren gut für spezifische Absichten, haben aber Schwierigkeiten mit komplexen Abfragen. Generative KI-Modelle verarbeiten eine größere Bandbreite an Eingaben, können aber Latenz verursachen.
  • Aktiviere den Express-Modus.

Optimieren Sie Ihren Cloud-Flow auf Leistung

Wenn Ihr Agent Power Automate Flow aufruft, stellen Sie sicher, dass Cloud-Flows optimiert sind.