Freigeben über


Szenarien zum Erstellen von Subagenten in azure SRE Agent Preview

Der Azure SRE-Agent verfügt über einen Subagent-Generator, mit dem Sie intelligente operative Subagenten entwerfen, konfigurieren und erweitern können, die auf die Anforderungen Ihrer Organisation zugeschnitten sind. Mit dem Subagent-Generator können Sie Datenquellen nahtlos integrieren, Wissensbasen verwalten und anreichern, spezialisierte Subagenten erstellen und Workflows mithilfe von Triggern und geplanten Vorgängen automatisieren. In diesem Artikel werden allgemeine Szenarien und Konfigurationsmuster erläutert, die Ihnen helfen, den Wert des Subagent-Generators für Ihre SRE-Vorgänge (Site Reliability Engineering) zu maximieren.

Verwenden Sie Ihre eigenen Datenquellen (Observability-Tools)

Mit dem Subgent-Generator können Sie Ihre vorhandene Observability-Infrastruktur verbinden, um die Funktionen Ihrer Subagenten zu verbessern.

Unterstützte Datenconnectors

Der SRE Agent unterstützt die folgenden Datenconnectors mit einer Schnittstelle zum Subagent-Generator:

  • Model Context Protocol (MCP):Stellen Sie eine Verbindung mit externen Datenquellen und APIs her.
  • Microsoft Teams: Veröffentlichen von Nachrichten in Teams-Kanälen.
  • Outlook: Senden von E-Mail-Benachrichtigungen.

Konfigurationsprozess

Führen Sie die folgenden Schritte aus, um Den Subagent zu konfigurieren.

  1. Navigieren Sie zu „Datenconnectors“.

    Wählen Sie im Subagent-Builder die Registerkarte Einstellungen Connectors> aus.

  2. Wählen Sie den Verbindertyp aus.

    Wählen Sie aus den verfügbaren Connectoroptionen aus.

  3. Geben Sie Verbindungsdetails an.

    Geben Sie Verbindungszeichenfolgen, Authentifizierungsanmeldeinformationen und Bereichseinstellungen ein.

  4. Testen Sie die Verbindung.

    Überprüfen Sie die Konnektivität und Berechtigungen vor dem Speichern.

  5. Ordnen Sie sie Subagents zu.

    Verknüpfen Sie Datenquellen mit bestimmten Subagenten basierend auf ihrem operativen Fokus.

Dateiupload und Knowledge Base-Verwaltung

Sie können das Wissen Ihrer Subagenten verbessern, indem Sie Dokumentation, Runbooks und Verfahrenshandbücher hochladen.

Nachfolgend finden Sie eine kurze Liste mit Beispielen für Dateien, die Sie Ihrem Agent hinzufügen können:

  • Architektur oder Systementwurf: Diagramme und Dokumentationen, die Systemkomponenten und Datenflüsse erläutern.

  • Anleitungen zur Problembehandlung: Schrittweise Anleitungen zum Diagnostizieren und Beheben häufiger oder wiederkehrender Probleme.

  • Runbooks und Standardbetriebsverfahren (SOPs): Detaillierte Workflows für Routinevorgänge, Wartung und Reaktion auf Vorfälle.

  • Vorfallberichte und Postmorteme: Dokumentation vergangener Ausfälle, einschließlich Ursachenanalyse und Erkenntnisse.

  • Versionshinweise und Änderungsprotokolle: Zusammenfassungen von Produkt- oder Dienstupdates, einschließlich neuer Features, Fehlerbehebungen und Änderungen.

Diese Dateitypen helfen Subagenten dabei, genaue, kontextbezogene Antworten bereitzustellen und operative Aufgaben effektiver zu automatisieren.

Unterstützte Dateitypen

Alle betrieblichen Prozeduren im Markdown-Format (.md) oder Text (.txt)

Dateiverwaltungsworkflow

  1. Greifen Sie auf die Wissensdatenbank zu, indem Sie zur Registerkarte Einstellungen > Wissensdatenbank > Dateien gehen.

  2. Laden Sie Dateien hoch, indem Sie Ihre Dateien ziehen und ablegen oder zum Auswählen von Dateien navigieren (maximal 50 MB pro Datei).

  3. Organisieren Sie Inhalte, indem Sie Kategorien und Beschreibungen hinzufügen, um die Suchbarkeit zu verbessern.

  4. Aktivieren Sie den Subagentenzugriff, indem Sie konfigurieren, welche Subagenten auf bestimmte Wissensquellen zugreifen können.

  5. Überwachen Sie die Nutzung, indem Sie nachverfolgen, wie Subagenten hochgeladenes Wissen in ihren Antworten verwenden.

Hinweis

Hochgeladene Dateien werden automatisch indiziert und von Ihren Subagenten durchsuchbar gemacht. Das System unterstützt bis zu 1.000 Dateien pro Subagentinstanz.

Erstellen Sie Ihre Subagenten

Erstellen Sie spezielle Subagenten, die sich auf bestimmte operative Domänen oder technische Bereiche konzentrieren.

Subagenttypen

Beispiele für spezialisierte Subagenten sind:

  • Datenbankspezialisten: Konzentrieren Sie sich auf die Datenbankleistung und Konnektivitätsdiagnose.

  • Netzwerkanalysten: Spezialisiert auf Konnektivitäts- und Leistungsprobleme.

  • Sicherheitsermittler: Geschult zu Sicherheitsvorfällen und Compliance-Prüfungen.

  • Anwendungsmonitore: Experten in bestimmten Anwendungsstapeln oder Frameworks.

Konfiguration von Subagenten

  • Zweck definieren: Geben Sie eindeutig den operativen Fokus und die Expertise des Subagents an.

  • Wählen Sie Tools aus: Wählen Sie relevante Systemtools und Datenkonnektoren für die Domäne des Subagents aus.

  • Anpassen von Anweisungen: Bereitstellen von domänenspezifischen Anleitungen und Betrieblichen Verfahren.

  • Festlegen von Übergaberegeln: Konfigurieren Sie, wie der Subagent an menschliche Operatoren oder andere Subagenten eskaliert.

  • Testfunktionen: Überprüfen der Leistung des Subagents für domänenspezifische Szenarien

Beispiel für die Konfiguration von Subagenten:

agent: 
  name: "WebApp-Performance-Specialist" 
  description: "Specialized subagent for web application performance analysis" 
  instructions: | 
    You are a specialist in diagnosing web application performance and reliability issues. 

    Focus on HTTP response codes, memory usage patterns, and application dependencies  

    when investigating incidents. 
  tools: 
    - "AzureMonitorQuery" 
    - "HttpHealthCheck"  
    - "ResourceHealthStatus" 
    - "DeploymentHistory" 
  handoff_conditions: 
    - "Infrastructure-level issues requiring network analysis" 
    - "Database performance issues requiring specialized expertise" 
    - "Security incidents requiring specialized investigation" 

Erweiterte Tools (integrierte Datenkonnektoren und MCP-Tools)

Erweitern Sie die Funktionen Ihrer Subagenten mit einem umfassenden Toolkit für operative Aufgaben.

Integrierte Systemtools

  • Azure-spezifische Tools:

    • Ressourcenverwaltung: Skalieren, Neustarten und Konfigurieren von Azure-Ressourcen

    • Azure Monitor-Abfragen: Ausführen von Abfragen für Azure Monitor-Protokolle und -Metriken

    • Integritätsprüfungen: Bewertung der Ressourcenintegrität und des Verfügbarkeitsstatus

    • Bereitstellungsanalyse: Überprüfen der letzten Änderungen und des Bereitstellungsverlaufs

  • Generische betriebstechnische Tools:

    • HTTP-Anforderungen: Testen der Endpunktverfügbarkeit und Antwortzeiten

    • Dateivorgänge: Lesen von Konfigurationsdateien und Protokollen

    • Datentransformation: Verarbeiten und Analysieren von Betriebsdaten

    • Benachrichtigungssysteme: Senden von Warnungen und Statusaktualisierungen

MCP-Integration (Model Context Protocol)

MCP ermöglicht Es Ihren Subagenten, über die systemeigenen Funktionen von Azure hinaus eine Verbindung mit externen Systemen und APIs herzustellen.

  • MCP-Verbindungseinrichtung:

    • Konfigurieren sie den MCP-Server: Richten Sie den externen Dienstendpunkt ein.

    • Authentifizierung: Stellen Sie erforderliche Anmeldeinformationen und Zugriffstoken bereit.

    • Toolsuche: Importieren Sie verfügbare Tools und Funktionen vom MCP-Server.

    • Zuordnung: Zuordnen von MCP-Tools zu bestimmten Subagenten.

  • Unterstützte MCP-Szenarien

    • Benutzerdefinierte APIs: Interne Tools und Dienste, die für Ihre Organisation spezifisch sind.

    • Integrationen von Drittanbietern: ServiceNow, Jira, Slack und andere operative Tools.

    • Spezialisierte Datenbanken: Zeitreihendatenbanken, Dokumentspeicher und Analyseplattformen.

    • Überwachungssysteme: Grafana, Prometheus und benutzerdefinierte Dashboards.

Von Bedeutung

MCP-Verbindungen erfordern eine ordnungsgemäße Netzwerkkonfiguration und Authentifizierung.

Trigger (Vorfälle und geplante Vorgänge)

Automatisieren Sie Ihre betrieblichen Workflows mit intelligenten Triggermechanismen.

Vorfallauslöser

Aktivieren Sie Subagenten automatisch, wenn bestimmte Vorfallbedingungen erfüllt sind, indem Sie die folgenden Konfigurationsoptionen anpassen:

  • Plattformintegration: Azure Monitor, PagerDuty oder ServiceNow.

  • Filterkriterien: Dienstwirkung, Schweregrad, Vorfalltyp und benutzerdefinierte Abgleichsregeln.

  • Reaktionszeitpunkt: Sofortige Aktivierung oder verzögerte Reaktion basierend auf der Dauer des Vorfalls.

  • Eskalationspfade: Definieren Sie Übergabeprozeduren, wenn die automatisierte Lösung fehlschlägt.

Beispiel für einen Vorfalltrigger:

trigger: 
  name: "High-CPU-Alert-Response" 
  platform: "AzureMonitor" 
  conditions: 
    - metric: "cpu_percent" 
    - threshold: "> 90%" 
    - duration: "5 minutes" 
    - service: "production-webapp" 
  response: 
    agent: "WebApp-Performance-Specialist" 
    mode: "review" 
    timeout: "30 minutes" 

Geplante Vorgänge

Erstellen Sie wiederkehrende betriebliche Aktivitäten, die automatisch ausgeführt werden:

  • Zeitplantypen:

    • Cron-Ausdrücke: Verwenden Sie die Standard-Cron-Syntax für eine genaue Zeitsteuerung.

    • Voreingestellte Intervalle: Stündliche, tägliche, wöchentliche oder monatliche Ausführung.

    • Natürliche Sprache: Beschreiben Sie Zeitpläne in einfachem Englisch (z. B. "jeden Wochentag um 9:00 Uhr").

  • Allgemeine geplante Vorgangsmuster:

    • Gesundheitszusammenfassungen: Tägliche Umgebungsstatusberichte.

    • Compliancescans: Wöchentliche Sicherheits- und Richtlinienüberprüfung.

    • Leistungsüberprüfungen: Monatliche Ressourcenauslastungsanalyse.

    • Wartungsprüfungen: Vierteljährliche Systemintegritätsbewertungen.

Beispiel für einen geplanten Vorgang:

scheduled_task: 
 name: "Daily-Environment-Health-Report" 
  schedule: "0 9 * * 1-5"  # Weekdays at 9 AM 
  timezone: "UTC" 
  instructions: | 
    Generate a comprehensive health report covering: 
    - Resource utilization trends (CPU, memory, storage) 
    - Active alerts and their resolution status 
    - Recent deployment impacts on performance 
    - Recommendations for optimization 
  outputs: 
    - email: "ops-team@company.com" 
    - teams_channel: "operations-reports"