Omówienie wdrażania modeli rozwiązania Microsoft Foundry

Uwaga / Notatka

Ten dokument odnosi się do portalu Microsoft Foundry (klasycznego).

🔍 Zapoznaj się z dokumentacją rozwiązania Microsoft Foundry (nową), aby dowiedzieć się więcej o nowym portalu.

Wykaz modeli w rozwiązaniu Microsoft Foundry to centrum do odnajdywania i używania szerokiej gamy modeli foundry do tworzenia aplikacji generacyjnych sztucznej inteligencji. Musisz wdrożyć modele, aby udostępnić je do odbierania żądań wnioskowania. Platforma Foundry oferuje kompleksowy zestaw opcji wdrażania dla modeli foundry w zależności od potrzeb i wymagań dotyczących modelu.

Opcje wdrożenia

Narzędzie Foundry udostępnia kilka opcji wdrażania w zależności od typu modeli i zasobów, które należy aprowizować. Dostępne są następujące opcje wdrażania:

Standardowe wdrożenie w zasobach Foundry
Wdrażanie interfejsu API do bezserwerowych punktów końcowych
Wdrażanie w zarządzanych obliczeniach

Portal foundry może automatycznie wybrać opcję wdrożenia na podstawie środowiska i konfiguracji. Zawsze, gdy jest to możliwe, użyj zasobów usługi Foundry do wdrożenia. Modele, które obsługują wiele opcji wdrażania, domyślnie korzystają z zasobów Foundry do wdrożenia. Aby uzyskać dostęp do innych opcji wdrażania, użyj interfejsu wiersza polecenia platformy Azure lub zestawu Azure Machine Learning SDK do wdrożenia.

Standardowe wdrożenie w zasobach Foundry

Zasoby usługi Foundry (wcześniej nazywane zasobami usług Azure AI Services) są preferowaną opcją wdrażania w rozwiązaniu Foundry. Oferuje najszerszy zakres możliwości, w tym przetwarzanie regionalne, strefowe lub globalne, oraz oferuje standardowe i zarezerwowaną przepustowość (PTU). Modele flagowe w Foundry Models obsługują tę opcję wdrażania.

Ta opcja wdrożenia jest dostępna w:

Zasoby Foundry
Zasoby usługi Azure OpenAI¹
Azure AI Hub, po połączeniu z zasobem Foundry

¹Jeśli używasz zasobów usługi Azure OpenAI, wykaz modeli zawiera tylko usługę Azure OpenAI w modelach usługi Foundry na potrzeby wdrażania. Pełną listę modeli Foundry można uzyskać, przechodząc na zasób Foundry.

Aby rozpocząć standardowe wdrażanie w zasobach Foundry, zobacz Instrukcje: wdrażanie modeli do Modeli Foundry.

Punkt końcowy bezserwerowego interfejsu API

Ta opcja wdrożenia jest dostępna tylko wzasobach centrum sztucznej inteligencji platformy Azure. Umożliwia tworzenie dedykowanych punktów końcowych do hostowania modelu, dostępnego za pośrednictwem interfejsu API. Modele foundry obsługują bezserwerowe punkty końcowe API z rozliczaniem według rzeczywistego użycia, a dla bezserwerowych punktów końcowych API można tworzyć tylko wdrożenia regionalne.

Aby rozpocząć wdrażanie w punkcie końcowym interfejsu API bez serwera, zobacz Wdrażanie modeli jako bezserwerowych wdrożeń interfejsu API.

Zarządzane obliczenia

Ta opcja wdrożenia jest dostępna tylko wzasobach centrum sztucznej inteligencji platformy Azure. Umożliwia utworzenie dedykowanego punktu końcowego do hostowania modelu w dedykowanym środowisku obliczeniowym. Aby hostować model, musisz mieć limit przydziału zasobów obliczeniowych w ramach subskrypcji, a opłaty są naliczane za czas pracy obliczeniowej.

Wdrożenie zarządzanego środowiska obliczeniowego jest wymagane w przypadku kolekcji modeli, które obejmują:

Przytulanie twarzy
Mikrousługi wnioskowania firmy NVIDIA (NIM)
Modele branżowe (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
Databricks
Modele niestandardowe

Aby rozpocząć, zobacz Jak wdrożyć i przeprowadzić inferencję na zarządzanej infrastrukturze obliczeniowej oraz Wdrażanie modelów Foundry na zarządzanej infrastrukturze obliczeniowej z rozliczaniem "pay-as-you-go" (Jak wdrażać i wnioskować zarządzane modele obliczeniowe przy użyciu rozliczeń z płatnością zgodnie z rzeczywistym użyciem).

Możliwości opcji wdrażania

Używaj Standardowych wdrożeń w zasobach Foundry, gdy tylko to możliwe. Ta opcja wdrożenia zapewnia najwięcej możliwości spośród dostępnych opcji wdrażania. W poniższej tabeli wymieniono szczegółowe informacje o określonych możliwościach dla każdej opcji wdrażania:

Zdolność	Standardowe wdrożenie w zasobach Foundry	Punkt końcowy bezserwerowego interfejsu API	Zarządzane obliczenia
Które modele można wdrożyć?	Modele odlewnicze	Modele Foundry z rozliczeniami typu pay-as-you-go	Otwieranie i modele niestandardowe
Zasób wdrożenia	Zasób usługi Foundry	Projekt sztucznej inteligencji (w zasobie centrum sztucznej inteligencji)	Projekt sztucznej inteligencji (w zasobie centrum sztucznej inteligencji)
Wymaga centrów sztucznej inteligencji	Nie.	Tak	Tak
Opcje przetwarzania danych	Regionalny Strefa danych Światowy	Regionalne	Regionalne
Sieć prywatna	Tak	Tak	Tak
Filtrowanie zawartości	Tak	Tak	Nie.
Niestandardowe filtrowanie zawartości	Tak	Nie.	Nie.
Uwierzytelnianie bez klucza	Tak	Nie.	Nie.
Podstawy rozliczeń	Użycie tokenów i jednostki przepływności o zastrzeżonej przepustowości	Użycie tokenu²	³ godziny rdzeni obliczeniowych

² Minimalna infrastruktura punktu końcowego jest rozliczana na minutę. Nie są naliczane opłaty za infrastrukturę, która hostuje model we wdrożeniu bezserwerowym. Po usunięciu punktu końcowego nie będą naliczane żadne dodatkowe opłaty.

³ Rozliczenia są naliczane na minutę, w zależności od warstwy produktu i liczby wystąpień używanych we wdrożeniu od momentu utworzenia. Po usunięciu punktu końcowego nie będą naliczane żadne dodatkowe opłaty.

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-11-18