Udostępnij przez


Scenariusze tworzenia podagentów w wersji zapoznawczej agenta usługi Azure SRE

Agent usługi Azure SRE oferuje konstruktora podrzędnego, który ułatwia projektowanie, konfigurowanie i rozszerzanie inteligentnych podagentów operacyjnych dostosowanych do potrzeb organizacji. Za pomocą konstruktora podrzędnego można bezproblemowo integrować źródła danych, zarządzać i wzbogacać bazy wiedzy, tworzyć wyspecjalizowane podagenty i automatyzować przepływy pracy przy użyciu wyzwalaczy i zaplanowanych zadań. W tym artykule omówiono typowe scenariusze i wzorce konfiguracji, które pomagają zmaksymalizować wartość narzędzia do tworzenia subagentów dla działań site reliability engineering (SRE).

Korzystanie z własnych źródeł danych (narzędzia do obserwacji)

Konstruktor subgent umożliwia łączenie istniejącej infrastruktury obserwacji w celu zwiększenia możliwości podagentów.

Obsługiwane łączniki danych

Agent SRE obsługuje następujące łączniki danych, które współpracują z konstruktorem podagentów:

  • Model Context Protocol (MCP): Połącz się z zewnętrznymi źródłami danych i interfejsami API.
  • Microsoft Teams: publikowanie komunikatów w kanałach usługi Teams.
  • Outlook: wysyłanie powiadomień e-mail.

Proces konfiguracji

Aby skonfigurować podagent, wykonaj następujące kroki.

  1. Przejdź do łączników danych.

    W konstruktorze podrzędnym wybierz kartę Ustawienia - Łączniki>.

  2. Wybierz typ łącznika.

    Wybierz spośród dostępnych opcji łącznika.

  3. Podaj szczegóły połączenia.

    Wprowadź parametry połączenia, poświadczenia uwierzytelniania i ustawienia zakresu.

  4. Przetestuj połączenie.

    Przed zapisaniem zweryfikuj łączność i uprawnienia.

  5. Kojarzenie z podagentami.

    Połącz źródła danych z określonymi podagentami na podstawie ich fokusu operacyjnego.

Przekazywanie plików i zarządzanie bazą wiedzy

Możesz zwiększyć wiedzę subagentów, udostępniając dokumentację, runbooki i przewodniki proceduralne.

Oto krótka lista przykładów plików, które można dodać do agenta:

  • Architektura lub projekt systemu: diagramy i dokumentacja, które wyjaśniają składniki systemu i przepływy danych.

  • Przewodniki rozwiązywania problemów: instrukcje krok po kroku dotyczące diagnozowania i rozwiązywania typowych lub powtarzających się problemów.

  • Runbooki i standardowe procedury operacyjne (SOP-y): szczegółowe przepływy pracy dla operacji rutynowych, konserwacji i reagowania na incydenty.

  • Raporty o zdarzeniach i analizy post-mortem: dokumentacja przeszłych awarii, w tym główna analiza przyczyn i wyciągnięte wnioski.

  • Informacje o wersji i dzienniki zmian: podsumowania aktualizacji produktu lub usługi, w tym nowych funkcji, poprawek błędów i zmian.

Te rodzaje plików pomagają subagentom zapewniać dokładne, kontekstualne odpowiedzi i efektywnie automatyzować zadania operacyjne.

Typy obsługiwanych plików

Wszelkie procedury operacyjne w formacie Markdown (.md) lub tekst (.txt).

Przepływ pracy zarządzania plikami

  1. Uzyskaj dostęp do bazy wiedzy, przechodząc do karty Ustawienia > Pliki bazy > wiedzy .

  2. Przekaż pliki, przeciągając i upuszczając pliki lub przeglądając, aby wybrać pliki (maksymalnie 50 MB na plik).

  3. Organizowanie zawartości przez dodanie tagów i opisów w celu uzyskania lepszej możliwości wyszukiwania.

  4. Włącz dostęp podrzędny, konfigurując, które podagenty mogą uzyskiwać dostęp do określonych źródeł wiedzy.

  5. Monitoruj użycie, śledząc, jak subagenty używają przekazanej wiedzy w odpowiedziach.

Uwaga / Notatka

Przekazane pliki są automatycznie indeksowane i możliwe do przeszukiwania przez podagentów. System obsługuje maksymalnie 1000 plików na wystąpienie podrzędne.

Tworzenie podagentów

Utwórz wyspecjalizowane podagenty, które koncentrują się na określonych domenach operacyjnych lub obszarach technicznych.

Typy subagentów

Przykłady wyspecjalizowanych podagentów to:

  • Specjaliści ds. baz danych: skoncentruj się na wydajności bazy danych i diagnostyce łączności.

  • Analitycy sieci: specjalizują się w problemach z łącznością i wydajnością.

  • Badacze zabezpieczeń: przeszkoleni w zakresie zdarzeń zabezpieczeń i kontroli zgodności.

  • Monitory aplikacji: eksperci w określonych stosach aplikacji lub strukturach.

Konfiguracja podagenta

  • Zdefiniuj cel: Jasno określ fokus operacyjny i wiedzę specjalistyczną subagenta.

  • Wybierz narzędzia: wybierz odpowiednie narzędzia systemowe i łączniki danych dla domeny podrzędnej.

  • Dostosowywanie instrukcji: podaj wskazówki specyficzne dla domeny i procedury operacyjne.

  • Ustaw reguły przekazywania: skonfiguruj sposób, w jaki subagent przekazuje zadania operatorom ludzkim lub innym subagentom.

  • Możliwości testowania: weryfikowanie wydajności podagentu w scenariuszach specyficznych dla domeny

Przykład konfiguracji subagenta:

agent: 
  name: "WebApp-Performance-Specialist" 
  description: "Specialized subagent for web application performance analysis" 
  instructions: | 
    You are a specialist in diagnosing web application performance and reliability issues. 

    Focus on HTTP response codes, memory usage patterns, and application dependencies  

    when investigating incidents. 
  tools: 
    - "AzureMonitorQuery" 
    - "HttpHealthCheck"  
    - "ResourceHealthStatus" 
    - "DeploymentHistory" 
  handoff_conditions: 
    - "Infrastructure-level issues requiring network analysis" 
    - "Database performance issues requiring specialized expertise" 
    - "Security incidents requiring specialized investigation" 

Rozszerzone narzędzia (wbudowane łączniki danych i narzędzia MCP)

Rozwiń możliwości podagentów za pomocą kompleksowego zestawu narzędzi do wykonywania zadań operacyjnych.

Wbudowane narzędzia systemowe

  • Narzędzia specyficzne dla platformy Azure:

    • Zarządzanie zasobami: skalowanie, ponowne uruchamianie i konfigurowanie zasobów platformy Azure

    • Zapytania usługi Azure Monitor: wykonywanie zapytań względem dzienników i metryk usługi Azure Monitor

    • Kontrole kondycji: ocena kondycji zasobów i stanu dostępności

    • Analiza wdrożenia: Przeglądanie ostatnich zmian i historii wdrażania

  • Ogólne narzędzia operacyjne:

    • Żądania HTTP: testowanie dostępności punktu końcowego i czasów odpowiedzi

    • Operacje na plikach: odczytywanie plików konfiguracji i dzienników

    • Przekształcanie danych: przetwarzanie i analizowanie danych operacyjnych

    • Systemy powiadomień: wysyłanie alertów i aktualizacji stanu

Integracja protokołu MCP (Model Context Protocol)

McP umożliwia subagentom łączenie się z systemami zewnętrznymi i interfejsami API poza możliwościami natywnymi platformy Azure.

  • Konfiguracja połączenia MCP:

    • Konfigurowanie serwera MCP: skonfiguruj zewnętrzny punkt końcowy usługi.

    • Uwierzytelnianie: podaj niezbędne poświadczenia i tokeny dostępu.

    • Odnajdywanie narzędzi: zaimportuj dostępne narzędzia i funkcje z serwera MCP.

    • Przypisanie: Kojarzenie narzędzi MCP z określonymi podagentami.

  • Obsługiwane scenariusze mcp

    • Niestandardowe interfejsy API: wewnętrzne narzędzia i usługi specyficzne dla twojej organizacji.

    • Integracje innych firm: ServiceNow, Jira, Slack i inne narzędzia operacyjne.

    • Wyspecjalizowane bazy danych: bazy danych szeregów czasowych, magazyny dokumentów i platformy analityczne.

    • Systemy monitorowania: Grafana, Prometheus i niestandardowe pulpity nawigacyjne.

Ważne

Połączenia MCP wymagają prawidłowej konfiguracji sieci i uwierzytelniania.

Wyzwalacze (zdarzenia i zaplanowane zadania)

Automatyzowanie przepływów pracy operacyjnych za pomocą inteligentnych mechanizmów wyzwalania.

Wyzwalacze zdarzeń

Automatyczne aktywowanie podagentów po spełnieniu określonych warunków zdarzenia przez dostosowanie następujących opcji konfiguracji:

  • Integracja platformy: Azure Monitor, PagerDuty lub ServiceNow.

  • Kryteria filtrowania: wpływ usługi, poziom dotkliwości, typ incydentu i niestandardowe reguły dopasowywania.

  • Czas odpowiedzi: natychmiastowa aktywacja lub opóźniona odpowiedź na podstawie czasu trwania zdarzenia.

  • Ścieżki eskalacji: zdefiniuj procedury przekazywania, gdy automatyczne rozwiązywanie nie powiedzie się.

Przykładowy wyzwalacz zdarzenia:

trigger: 
  name: "High-CPU-Alert-Response" 
  platform: "AzureMonitor" 
  conditions: 
    - metric: "cpu_percent" 
    - threshold: "> 90%" 
    - duration: "5 minutes" 
    - service: "production-webapp" 
  response: 
    agent: "WebApp-Performance-Specialist" 
    mode: "review" 
    timeout: "30 minutes" 

Zaplanowane zadania

Utwórz cykliczne działania operacyjne, które są uruchamiane automatycznie:

  • Typy harmonogramów:

    • Wyrażenia Cron: użyj standardowej składni cron w celu dokładnego chronometrażu.

    • Interwały wstępne: co godzinę, codziennie, co tydzień lub co miesiąc.

    • Język naturalny: opis harmonogramów w języku angielskim (na przykład "każdy dzień powszedni o 9:00").

  • Typowe wzorce zaplanowanych zadań:

    • Podsumowania kondycji: raporty o stanie codziennego środowiska.

    • Skanowanie zgodności: cotygodniowe sprawdzanie poprawności zabezpieczeń i zasad.

    • Przeglądy wydajności: Miesięczna analiza wykorzystania zasobów.

    • Kontrole konserwacji: kwartalne oceny kondycji systemu.

Przykład zaplanowanego zadania:

scheduled_task: 
 name: "Daily-Environment-Health-Report" 
  schedule: "0 9 * * 1-5"  # Weekdays at 9 AM 
  timezone: "UTC" 
  instructions: | 
    Generate a comprehensive health report covering: 
    - Resource utilization trends (CPU, memory, storage) 
    - Active alerts and their resolution status 
    - Recent deployment impacts on performance 
    - Recommendations for optimization 
  outputs: 
    - email: "ops-team@company.com" 
    - teams_channel: "operations-reports"