Udostępnij przez


Omówienie uruchamiania agentów w systemie Windows

Uruchamianie agentów w systemie Windows zapewnia ustandaryzowany sposób rejestrowania agentów sztucznej inteligencji i umożliwia odnajdywanie ich w całym systemie. Dzięki temu użytkownicy mogą uzyskiwać dostęp do agentów z dowolnego środowiska pomocniczego, takiego jak z menu Start, wyszukiwania lub w aplikacjach, bez konieczności znajomości, która aplikacja udostępnia każdego agenta.

Co to jest uruchamianie agenta?

Program uruchamiający agenta to zarejestrowany punkt wejścia dla agenta sztucznej inteligencji w systemie Windows. Bez użycia agentów uruchamiających, każde doświadczenie będzie potrzebować niestandardowego kodu integracji dla każdego z tych agentów — niezależnie od tego, czy jest używany protokół Model Context Protocol (MCP), Działania aplikacji, czy zastrzeżone interfejsy API. Uruchamianie agentów rozwiązuje ten problem, zapewniając ujednolicony mechanizm rejestracji i odnajdywania, w którym aplikacje rejestrują swoich agentów raz, udostępniając je wszystkim środowiskom pomocniczym.

Co to jest agent?

W kontekście uruchamiania agentów agenci są asystentami opartymi na sztucznej inteligencji przeznaczonymi do aktywnych, trwających konwersacji, które ułatwiają użytkownikom wykonywanie złożonych zadań. Są to więcej niż czatboty lub procesory żądań jednorazowych:

  • Interakcyjne i konwersacyjne: angażowanie się w dialogi wieloturnowe, zadawanie pytań wyjaśniających i dostarczanie kontekstowych odpowiedzi
  • Zorientowane na zadanie: Pomoc użytkownikom w realizacji określonych celów— od planowania podróży po analizowanie danych po tworzenie zawartości
  • Świadomość kontekstowa: zrozumienie i utrzymanie kontekstu podczas rozmów, pamiętanie poprzednich interakcji
  • Zdolny do wykonywania akcji: Podejmowanie działań w imieniu użytkowników i integracja z funkcjami aplikacji, aby realizować zadania
  • Widoczne i dostępne: otwórz interfejs użytkownika, w którym użytkownicy mogą aktywnie korzystać, wyświetlać postęp i prowadzić swoją pracę

Moduły uruchamiania agentów są przeznaczone dla agentów, którzy oferują interaktywne doświadczenia, gdzie użytkownicy i sztuczna inteligencja współpracują, a nie do usług w tle ani cichej automatyzacji.

Zalety korzystania z uruchamiania agentów?

Dla użytkowników

  • Ujednolicone odnajdywanie: znajdź wszystkich dostępnych agentów z dowolnego środowiska pomocniczego bez zapamiętywania, która aplikacja zawiera jakiego agenta.
  • Bezproblemowa integracja: uzyskaj dostęp do agentów z różnych kontekstów, w tym z menu Start, wyszukiwania lub w innych aplikacjach.
  • Spójne środowisko: Interakcja z agentami za pomocą spójnych, znanych wzorców niezależnie od dostawcy.

Dla deweloperów

  • Pojedyncza integracja: zarejestruj agenta raz i udostępnij go wszystkim środowiskom pomocniczym.
  • Elastyczne wdrażanie: zarejestruj agentów statycznie w czasie instalacji lub dynamicznie w czasie wykonywania na podstawie uwierzytelniania, subskrypcji lub innych warunków.
  • Zasięg ekosystemu: skorzystaj ze standardowej struktury akcji aplikacji, aby wykorzystać rosnący ekosystem.

W przypadku środowisk i platform

  • Łatwe odnajdywanie: wykonaj zapytanie dotyczące rejestru urządzeń (ODR, On-Device Registry), aby znaleźć wszystkich zarejestrowanych agentów w systemie.
  • Niezawodne wywołanie: uruchamianie agentów za pomocą ustandaryzowanego mechanizmu z dobrze zdefiniowanymi danymi wejściowymi.
  • Brak integracji niestandardowych: obsługa wszystkich agentów bez kodu specyficznego dla aplikacji.

Jak działają uruchamianie agentów

Uruchamianie agentów jest oparte na strukturze akcji aplikacji systemu Windows. Moduł uruchamiania agenta składa się z następujących elementów:

  • Manifest definicji agenta: plik JSON z metadanymi, w tym nazwa wyświetlana, opis, unikatowy identyfikator i akcja aplikacji do wywołania
  • Deklaracja rozszerzenia aplikacji: wpis w manifeście pakietu aplikacji, który rejestruje agenta w systemie Windows
  • Akcja aplikacji z wymaganymi jednostkami: Akcja aplikacji z wymaganymi agentName danymi wejściowymi i prompt opcjonalnymi jednostkami, takimi jak attachedFile

Agenci są rejestrowani i pobierani w Rejestrze Urządzenia (ODR) za pomocą narzędzia wiersza polecenia odr.exe. Rejestracja może być statyczna (w czasie instalacji) lub dynamiczna (w czasie wykonywania). Po wywołaniu system lokalizuje skojarzona akcję aplikacji i uruchamia ją z monitem i kontekstem użytkownika, otwierając interfejs agenta na potrzeby interakcji.

Wprowadzenie

Aby dowiedzieć się, jak utworzyć moduł uruchamiania agenta dla aplikacji systemu Windows, zobacz Wprowadzenie do uruchamiania agentów w systemie Windows.

Aby uzyskać szczegółowe informacje na temat schematu JSON definicji agenta, zobacz Schemat JSON definicji agenta.