Udostępnij przez


Polecane modele katalogu modeli Foundry

Katalog modeli foundry oferuje duży wybór modeli od wielu dostawców. Dostępne są różne opcje wdrażania modeli z katalogu modeli. W tym artykule wymieniono polecane modele w katalogu modeli, które można wdrożyć i hostować na serwerach firmy Microsoft za pośrednictwem wdrożeń standardowych. W przypadku niektórych z tych modeli można je również hostować w infrastrukturze na potrzeby wdrażania za pośrednictwem zarządzanych zasobów obliczeniowych. Zobacz Dostępne modele dla obsługiwanych opcji wdrażania , aby znaleźć modele w katalogu, które są dostępne do wdrożenia za pośrednictwem zarządzanego środowiska obliczeniowego lub standardowego wdrożenia.

Aby przeprowadzić wnioskowanie z modelami, niektóre modele, takie jak TimeGEN-1 firmy Nixtla i Cohere rerank wymagają używania niestandardowych interfejsów API od dostawców modelu. Inni obsługują wnioskowanie przy użyciu modelu AI platformy Azure. Więcej szczegółów na temat poszczególnych modeli można znaleźć, przeglądając ich karty modeli w wykazie modeli.

Animacja przedstawiająca sekcję wykazu modeli programu Foundry i dostępne modele.

Laboratoria AI21

Modele rodziny Jamba to duże modele językowe (LLM) klasy produkcyjnej AI21, oparte na Mamba i wykorzystujące hybrydową architekturę Mamba-Transformer AI21. Jest to wersja dostosowana do instrukcji hybrydowego modelu strukturalnej przestrzeni stanów (SSM, Structured State Space Model) transformatora Jamba. Modele rodziny Jamba są tworzone pod kątem niezawodnego użytku komercyjnego w odniesieniu do jakości i wydajności.

Model Typ Capabilities
AI21-Jamba-1.5-Mini chat-completion - Dane wejściowe: tekst (tokeny 262 144)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst, JSON, dane wyjściowe ze strukturą
AI21-Jamba-1.5-Large chat-completion - Dane wejściowe: tekst (tokeny 262 144)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst, JSON, dane wyjściowe ze strukturą

Zobacz tę kolekcję modeli w katalogu modeli.

Azure OpenAI

Usługa Azure OpenAI w usłudze Microsoft Foundry Models oferuje zróżnicowany zestaw modeli z różnymi możliwościami i punktami cenowymi. Te modele obejmują:

  • Najnowocześniejsze modele zaprojektowane do rozwiązywania zadań związanych z rozumowaniem i rozwiązywaniem problemów z większą koncentracją i zwiększonymi możliwościami.
  • Modele, które mogą zrozumieć i wygenerować język naturalny i kod
  • Modele, które mogą transkrybować i tłumaczyć mowę na tekst
Model Typ Capabilities
o3-mini chat-completion - Dane wejściowe: tekst i obraz (200 000 tokenów)
- Dane wyjściowe: tekst (100 000 tokenów)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst, JSON, dane wyjściowe ze strukturą
o1 zakończenie czatu (z obrazami) - Dane wejściowe: tekst i obraz (200 000 tokenów)
- Dane wyjściowe: tekst (100 000 tokenów)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst, JSON, dane wyjściowe ze strukturą
o1-preview chat-completion - Wejście: tekst (128 000 tokenów)
- Dane wyjściowe: tekst (tokeny 32 768)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst, JSON, dane wyjściowe ze strukturą
o1-mini chat-completion - Wejście: tekst (128 000 tokenów)
- Dane wyjściowe: tekst (tokeny 65 536)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
gpt-4o-realtime-preview czas rzeczywisty - Dane wejściowe: kontrolka, tekst i dźwięk (tokeny 131 072)
- Dane wyjściowe: tekst i dźwięk (tokeny 16 384)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
gpt-4o uzupełnianie czatu (z zawartością obrazu i dźwięku) - Dane wejściowe: tekst, obraz i dźwięk (tokeny 131 072)
- Dane wyjściowe: tekst (16,384 tokenów)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst, JSON, dane wyjściowe ze strukturą
gpt-4o-mini uzupełnianie czatu (z zawartością obrazu i dźwięku) - Dane wejściowe: tekst, obraz i dźwięk (tokeny 131 072)
- Dane wyjściowe: tekst (16,384 tokenów)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst, JSON, dane wyjściowe ze strukturą
text-embedding-3-large embeddings - Dane wejściowe: tekst (8 191 tokenów)
- Wyjście: Wektor (3072 wym.)
text-embedding-3-small embeddings - Dane wejściowe: tekst (8 191 tokenów)
- Wyjście: Wektor (1,536 wym.)

Zobacz tę kolekcję modeli w katalogu modeli.

Cohere

Rodzina modeli Cohere obejmuje różne modele zoptymalizowane pod kątem różnych przypadków użycia, w tym ponowne sortowanie, uzupełnianie czatów i modele osadzania.

Cohere komenda i osadzanie

W poniższej tabeli wymieniono modele Cohere, które można wnioskować za pośrednictwem wnioskowania modelu AI platformy Azure.

Model Typ Capabilities
Cohere-command-A chat-completion - Dane wejściowe: tekst (256 000 tokenów)
- Dane wyjściowe: tekst (8000 tokenów)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst
Cohere-command-r-plus-08-2024 chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Cohere-command-r-08-2024 chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Cohere-command-r-plus
(deprecated)
chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Cohere-command-r
(deprecated)
chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Cohere-embed-4 embeddings
image-embeddings
- Dane wejściowe: obraz, tekst
- Dane wyjściowe: obraz, tekst (128 000 tokenów)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: obraz, tekst
Cohere-embed-v3-english embeddings
image-embeddings
- Dane wejściowe: tekst (tokeny 512)
- Wyjście: Wektor (1,024 wym.).
Cohere-embed-v3-multilingual embeddings
image-embeddings
- Dane wejściowe: tekst (tokeny 512)
- Wyjście: Wektor (1,024 wym.).

Przykłady wnioskowania: komenda Cohere i embedding

Aby uzyskać więcej przykładów używania modeli Cohere, zobacz następujące przykłady:

Description Język Sample
Żądania internetowe Bash Command-RCommand-R+
cohere-embed.ipynb
Pakiet wnioskowania sztucznej inteligencji platformy Azure dla języka C# C# Link
Pakiet wnioskowania usługi Azure AI dla języka JavaScript JavaScript Link
Pakiet wnioskowania usługi Azure AI dla języka Python Python Link
OpenAI SDK (eksperymentalny) Python Link
LangChain Python Link
Cohere SDK Python Command
Embed
LiteLLM SDK Python Link

Generowanie wspomagane odzyskiwaniem (RAG) i wykorzystanie narzędzi: przykłady komend Cohere i integrowania

Description Packages Sample
Tworzenie lokalnego indeksu wektorów wyszukiwania sztucznej inteligencji (FAISS) w serwisie Facebook przy użyciu osadzania Cohere — Langchain langchain, langchain_cohere cohere_faiss_langchain_embed.ipynb
Użyj polecenia Cohere R/R+, aby odpowiedzieć na pytania z danych w lokalnym indeksie wektorów FAISS — Langchain langchain, langchain_cohere command_faiss_langchain.ipynb
Użyj polecenia Cohere R/R+, aby odpowiedzieć na pytania z danych w indeksie wektora wyszukiwania sztucznej inteligencji — Langchain langchain, langchain_cohere cohere-aisearch-langchain-rag.ipynb
Użyj Cohere Command R/R+, aby odpowiedzieć na pytania dotyczące danych w indeksie wyszukiwania wektorowego AI — Cohere SDK cohere, azure_search_documents cohere-aisearch-rag.ipynb
Wywoływanie narzędzia/funkcji Command R+ przy użyciu LangChain cohere, langchainlangchain_cohere command_tools-langchain.ipynb

Cohere ponowne uporządkowanie

W poniższej tabeli wymieniono modele Cohere rerank. Aby przeprowadzić wyciąganie wniosków przy użyciu tych modeli ponownego klasyfikowania, musisz użyć niestandardowych interfejsów API Cohere do ponownego klasyfikowania, wymienionych w tabeli.

Model Typ Interfejs API wnioskowania
Cohere-rerank-v3.5 rerank
klasyfikacja tekstu
Cohere API v2/rerank
Cohere-rerank-v3-english
(deprecated)
rerank
klasyfikacja tekstu
Cohere API v2/rerank
Interfejs API Cohere w wersji v1/rerank
Cohere-rerank-v3-multilingual
(deprecated)
rerank
klasyfikacja tekstu
Cohere API v2/rerank
Interfejs API Cohere w wersji v1/rerank

Cennik modeli do ponownego rangowania Cohere

Zapytania, które nie należy mylić z zapytaniem użytkownika, to miernik cen, który odnosi się do kosztów skojarzonych z tokenami używanymi jako dane wejściowe dla wnioskowania modelu Cohere Rerank. Cohere zlicza pojedynczą jednostkę wyszukiwania jako zapytanie z maksymalnie 100 dokumentami do sklasyfikowania. Dokumenty dłuższe niż 500 tokenów (dla Cohere-rerank-v3.5) lub dłuższe niż 4096 tokenów (dla Cohere-rerank-v3-English i Cohere-rerank-v3-wielojęzyczne) w przypadku uwzględnienia długości zapytania wyszukiwania są podzielone na wiele fragmentów, gdzie każdy fragment jest liczone jako pojedynczy dokument.

Zobacz kolekcję modeli Cohere w katalogu modeli.

Core42

Core42 zawiera autoregresywne, dwujęzyczne modele językowe (LLM) dla języka arabskiego i angielskiego z najnowocześniejszymi możliwościami dla języka arabskiego.

Model Typ Capabilities
jais-30b-chat chat-completion - Dane wejściowe: tekst (8192 tokeny)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON

Zobacz tę kolekcję modeli w katalogu modeli.

Przykłady wnioskowania: Core42

Aby uzyskać więcej przykładów używania modeli Jais, zobacz następujące przykłady:

Description Język Sample
Pakiet wnioskowania sztucznej inteligencji platformy Azure dla języka C# C# Link
Pakiet wnioskowania usługi Azure AI dla języka JavaScript JavaScript Link
Pakiet wnioskowania usługi Azure AI dla języka Python Python Link

DeepSeek

Rodzina modeli DeepSeek obejmuje DeepSeek-R1, który wyróżnia się w zadaniach wymagających rozumowania, wykorzystując proces treningowy krok po kroku, takich jak językowe, naukowe oraz związane z kodowaniem. W jej skład wchodzi również DeepSeek-V3-0324, model językowy typu Mixture-of-Experts (MoE), oraz inne.

Model Typ Capabilities
DeekSeek-V3-0324 chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: (131 072 tokeny)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: Tekst, JSON
DeepSeek-V3
(Legacy)
chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 131 072)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: Tekst, JSON
DeepSeek-R1 uzupełnianie czatu zawartością analityczną - Dane wejściowe: tekst (163 840 tokenów)
- Dane wyjściowe: tekst (163 840 tokenów)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst.

Aby zapoznać się z samouczkiem dotyczącym DeepSeek-R1, zobacz Samouczek: rozpocząć pracę z modelem rozumowania DeepSeek-R1 w wnioskowaniu modelu AI platformy Azure.

Zobacz tę kolekcję modeli w katalogu modeli.

Przykłady wnioskowania: DeepSeek

Aby uzyskać więcej przykładów używania modeli DeepSeek, zobacz następujące przykłady:

Description Język Sample
Pakiet wnioskowania usługi Azure AI dla języka Python Python Link
Pakiet wnioskowania usługi Azure AI dla języka JavaScript JavaScript Link
Pakiet wnioskowania sztucznej inteligencji platformy Azure dla języka C# C# Link
Pakiet wnioskowania sztucznej inteligencji platformy Azure dla języka Java Java Link

Meta

Modele i narzędzia Meta Llama to kolekcja wstępnie wytrenowanych i dostrojonych modeli generowania tekstu i rozumowania obrazów sztucznej inteligencji. Zakres modeli metadanych jest skalowany w celu uwzględnienia:

  • Modele językowe o małej skali (SLM), takie jak modele 1B i 3B Base oraz Instruct do wnioskowania na urządzeniach i urządzeniach brzegowych.
  • Modele językowe o średniej wielkości (LLM), takie jak modele 7B, 8B i 70B w wersjach podstawowej i instruktorskiej
  • Wysoce wydajne modele, takie jak Meta Llama 3.1-405B Instruct, do generowania syntetycznych danych i przypadków użycia destylacji.
  • Wysokowydajne natywne modele multimodalne, Llama 4 Scout i Llama 4 Maverick, wykorzystują architekturę złożoną z mieszanki ekspertów, aby zapewnić najlepszą na rynku wydajność w zrozumieniu tekstu i obrazów.
Model Typ Capabilities
Llama-4-Scout-17B-16E-Instruct chat-completion - Dane wejściowe: tekst i obraz (128 000 tokenów)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst
Llama 4-Maverick-17B-128E-Instruct-FP8 chat-completion - Dane wejściowe: tekst i obraz (128 000 tokenów)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: tekst
Llama-3.3-70B-Instruct chat-completion - Wejście: tekst (128 000 tokenów)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Llama-3.2-90B-Vision-Instruct zakończenie czatu (z obrazami) - Dane wejściowe: tekst i obraz (128 000 tokenów)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Llama-3.2-11B-Vision-Instruct zakończenie czatu (z obrazami) - Dane wejściowe: tekst i obraz (128 000 tokenów)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Meta-Llama-3.1-8B-Instruct chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Meta-Llama-3.1-405B-Instruct chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Meta-Llama-3.1-70B-Instruct (przestarzałe) chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Meta-Llama-3-8B-Poinstruowanie (przestarzałe) chat-completion - Dane wejściowe: tekst (8192 tokeny)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Meta-Llama-3-70B-Instruct (przestarzałe) chat-completion - Dane wejściowe: tekst (8192 tokeny)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst

Zobacz tę kolekcję modeli w katalogu modeli.

Przykłady wnioskowania: Meta Llama

Aby uzyskać więcej przykładów używania modeli Meta Llama, zobacz następujące przykłady:

Description Język Sample
Żądanie CURL Bash Link
Pakiet wnioskowania sztucznej inteligencji platformy Azure dla języka C# C# Link
Pakiet wnioskowania usługi Azure AI dla języka JavaScript JavaScript Link
Pakiet wnioskowania usługi Azure AI dla języka Python Python Link
Żądania internetowe języka Python Python Link
OpenAI SDK (eksperymentalny) Python Link
LangChain Python Link
LiteLLM Python Link

Microsoft

Modele firmy Microsoft obejmują różne grupy modeli, takie jak modele MAI, modele Phi, modele sztucznej inteligencji dla opieki zdrowotnej i inne. Aby wyświetlić wszystkie dostępne modele firmy Microsoft, wyświetl kolekcję modeli firmy Microsoft w portalu Foundry.

Model Typ Capabilities
MAI-DS-R1 uzupełnianie czatu zawartością analityczną - Dane wejściowe: tekst (163 840 tokenów)
- Dane wyjściowe: tekst (163 840 tokenów)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst.
Phi-4-reasoning uzupełnianie czatu zawartością analityczną - Dane wejściowe: tekst (tokeny 32768)
- Dane wyjściowe: tekst (tokeny 32768)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-4-mini-reasoning uzupełnianie czatu zawartością analityczną - Wejście: tekst (128 000 tokenów)
- Dane wyjściowe: tekst (128 000 tokenów)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-4-multimodal-instruct uzupełnianie czatu (z zawartością obrazu i dźwięku) - Dane wejściowe: tekst, obrazy i dźwięk (tokeny 131 072)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-4-mini-instruct chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-4 chat-completion - Dane wejściowe: tekst (16 384 tokenów)
- Dane wyjściowe: tekst (16,384 tokenów)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-3.5-mini-instruct chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-3.5-MoE-instruct chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-3.5-vision-instruct zakończenie czatu (z obrazami) - Dane wejściowe: tekst i obraz (tokeny 131 072)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-3-mini-128k-instruct chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-3-mini-4k-instruct chat-completion - Dane wejściowe: tekst (tokeny 4096)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-3-small-128k-instruct chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-3-small-8k-instruct chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-3-medium-128k-instruct chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Phi-3-medium-4k-instruct chat-completion - Dane wejściowe: tekst (tokeny 4096)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst

Przykłady wnioskowania: modele firmy Microsoft

Aby uzyskać więcej przykładów używania modeli firmy Microsoft, zobacz następujące przykłady:

Description Język Sample
Pakiet wnioskowania sztucznej inteligencji platformy Azure dla języka C# C# Link
Pakiet wnioskowania usługi Azure AI dla języka JavaScript JavaScript Link
Pakiet wnioskowania usługi Azure AI dla języka Python Python Link
LangChain Python Link
Llama-Index Python Link

Zobacz kolekcję modeli firmy Microsoft w katalogu modeli.

Mistral Sztuczna Inteligencja

Mistral AI oferuje dwie kategorie modeli, a mianowicie:

  • Modele Premium: są to modele Mistral Large, Mistral Small, Mistral-OCR-2503, Mistral Medium 3 (25.05) i Ministral 3B, dostępne jako interfejsy API bez serwera z rozliczeniami opartymi na użyciu tokenów.
  • Otwarte modele: należą do nich Mistral-small-2503, Codestral i Mistral Nemo (które są dostępne jako bezserwerowe interfejsy API z rozliczeniami opartymi na tokenach płatności zgodnie z rzeczywistym użyciem) i Mixtral-8x7B-Instruct-v01, Mixtral-8x7B-v01, Mistral-7B-Instruct-v01 i Mistral-7B-v01 (które są dostępne do pobierania i uruchamiania na własnych zarządzanych punktach końcowych).
Model Typ Capabilities
Codestral-2501 chat-completion - Dane wejściowe: tekst (tokeny 262 144)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst
Ministral-3B chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Mistral-Nemo chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Mistral-Large-2411 chat-completion - Wejście: tekst (128 000 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Mistral-large-2407
(deprecated)
chat-completion - Dane wejściowe: tekst (131 072 tokenów)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Mistral-large
(deprecated)
chat-completion - Dane wejściowe: tekst (tokeny 32 768)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Mistral-medium-2505 chat-completion - Dane wejściowe: tekst (128 000 tokenów), obraz
- Dane wyjściowe: tekst (128 000 tokenów)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: Tekst, JSON
Mistral-OCR-2503 obraz do tekstu - Dane wejściowe: obrazy lub strony PDF (1,000 stron, maksymalnie plik PDF 50 MB)
- Dane wyjściowe: tekst
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: Text, JSON, Markdown
Mistral-small-2503 zakończenie czatu (z obrazami) - Dane wejściowe: tekst i obrazy (tokeny 131 072),
Tokeny graficzne mają rozmiar 16x16px
bloki oryginalnych obrazów
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON
Mistral-small chat-completion - Dane wejściowe: tekst (tokeny 32 768)
- Dane wyjściowe: tekst (tokeny 4096)
- Wywoływanie narzędzi: Tak
- Formaty odpowiedzi: Tekst, JSON

Zobacz tę kolekcję modeli w katalogu modeli.

Przykłady wnioskowania: Mistral

Aby uzyskać więcej przykładów używania modeli Mistral, zobacz następujące przykłady i samouczki:

Description Język Sample
Żądanie CURL Bash Link
Pakiet wnioskowania sztucznej inteligencji platformy Azure dla języka C# C# Link
Pakiet wnioskowania usługi Azure AI dla języka JavaScript JavaScript Link
Pakiet wnioskowania usługi Azure AI dla języka Python Python Link
Żądania internetowe języka Python Python Link
OpenAI SDK (eksperymentalny) Python Mistral — przykład zestawu OpenAI SDK
LangChain Python Mistral: Przykład LangChain
Mistral Sztuczna Inteligencja Python Mistral — przykład „Mistral AI”
LiteLLM Python Mistral — przykład LiteLLM

Nixtla

TimeGEN-1 firmy Nixtla to wstępnie wytrenowany model prognozowania i wykrywania anomalii dla danych szeregów czasowych. TimeGEN-1 może generować dokładne prognozy dla nowych szeregów czasowych bez trenowania, używając tylko wartości historycznych i kowariantów egzogennych jako danych wejściowych.

Aby przeprowadzić wnioskowanie, funkcja TimeGEN-1 wymaga użycia niestandardowego interfejsu API wnioskowania Nixtla.

Model Typ Capabilities Interfejs API wnioskowania
TimeGEN-1 Forecasting - Wejście: Dane szeregów czasowych jako dane JSON lub ramki danych (z obsługą wejściowych wielowymiarowych)
- Wyjście: Dane szeregów czasowych jako dane JSON
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: JSON
Klient do prognozowania w celu interakcji z interfejsem API Nixtla

Szacowanie wymaganej liczby tokenów

Przed utworzeniem wdrożenia TimeGEN-1 warto oszacować liczbę tokenów, które planujesz zużyć i za które zostaniesz obciążony kosztami. Jeden token odpowiada jednemu punktowi danych w wejściowym zestawie danych lub wyjściowym zestawie danych.

Załóżmy, że masz następujący wejściowy zestaw danych szeregów czasowych:

Unique_id Timestamp Zmienna docelowa Zmienna egzogenna 1 Zmienna egzogenna 2
BE 2016-10-22 00:00:00 70.00 49593.0 57253.0
BE 2016-10-22 01:00:00 37.10 46073.0 51887.0

Aby określić liczbę tokenów, należy pomnożyć liczbę wierszy (w tym przykładzie dwa) i liczbę kolumn używanych do prognozowania — nie licząc kolumn unique_id i sygnatur czasowych (w tym przykładzie trzy), aby uzyskać łącznie sześć tokenów.

Biorąc pod uwagę następujący wyjściowy zestaw danych:

Unique_id Timestamp Prognozowana zmienna docelowa
BE 2016-10-22 02:00:00 46.57
BE 2016-10-22 03:00:00 48.57

Można również określić liczbę tokenów, zliczając liczbę punktów danych zwracanych po prognozowaniu danych. W tym przykładzie liczba tokenów to dwa.

Szacowanie cen na podstawie tokenów

Istnieją cztery mierniki cen, które określają cenę, którą płacisz. Te mierniki są następujące:

Miernik cen Description
paygo-inference-input-tokens Koszty skojarzone z tokenami używanymi jako dane wejściowe do wnioskowania, gdy finetune_steps = 0
paygo-inference-output-tokens Koszty skojarzone z tokenami używanymi jako dane wyjściowe do wnioskowania, gdy finetune_steps = 0
paygo-finetuned-model-inference-input-tokens Koszty skojarzone z tokenami używanymi jako dane wejściowe do wnioskowania, gdy finetune_steps> 0
paygo-finetuned-model-inference-output-tokens Koszty skojarzone z tokenami używanymi jako dane wyjściowe do wnioskowania, gdy finetune_steps> 0

Zobacz kolekcję modeli Nixtla w katalogu modeli.

NTT DATA

tsuzumi to zoptymalizowany do autoregresywnych języków model transformera. Dostrojone wersje używają nadzorowanego dostrajania (SFT). Tsuzumi z dużą wydajnością obsługuje zarówno język japoński, jak i angielski.

Model Typ Capabilities
tsuzumi-7b chat-completion - Dane wejściowe: tekst (8192 tokeny)
- Dane wyjściowe: tekst (tokeny 8192)
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: tekst

Stabilność sztucznej inteligencji

Kolekcja modeli generowania obrazów Stability AI obejmuje Stable Image Core, Stable Image Ultra i Stable Diffusion 3.5 Large. Stable Diffusion 3.5 Large umożliwia wprowadzanie obrazu i tekstu.

Model Typ Capabilities
Stable Diffusion Large 3.5 Generowanie obrazu - Dane wejściowe: tekst i obraz (1000 tokenów i 1 obraz)
- Dane wyjściowe: 1 obraz
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: Obraz (PNG i JPG)
Stabilny rdzeń obrazu Generowanie obrazu - Dane wejściowe: tekst (tokeny 1000)
- Dane wyjściowe: 1 obraz
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: Obraz (PNG i JPG)
Ultra Stabilny Obraz Generowanie obrazu - Dane wejściowe: tekst (tokeny 1000)
- Dane wyjściowe: 1 obraz
- Wywoływanie narzędzi: Nie
- Formaty odpowiedzi: Obraz (PNG i JPG)

Przykłady wnioskowania: Stabilność AI

Modele stabilne AI wdrożone w standardowych wdrożeniach implementują interfejs API wnioskowania na platformie Azure AI na ścieżce /image/generations. Aby zobaczyć, jak używać modeli Stability AI, zobacz poniższe przykłady.