Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Uwaga / Notatka
Ten dokument odnosi się do portalu Microsoft Foundry (klasycznego).
🔍 Zapoznaj się z dokumentacją rozwiązania Microsoft Foundry (nową), aby dowiedzieć się więcej o nowym portalu.
Ten artykuł zawiera szczegółowe informacje na temat punktów końcowych interfejsu API REST wnioskowania dla usługi Azure OpenAI.
Specyfikacje interfejsu API
Zarządzanie modelami i zasobami Azure OpenAI oraz interakcja z nimi są podzielone na trzy podstawowe elementy interfejsu API.
- Płaszczyzna sterowania
- Płaszczyzna danych — tworzenie
- Płaszczyzna danych — wnioskowanie
Każda powierzchnia/specyfikacja interfejsu API hermetyzuje inny zestaw funkcji usługi Azure OpenAI. Każdy interfejs API ma swój własny unikatowy zestaw wersji zapoznawczych i stabilne/ogólnie dostępne wersje interfejsu API. Obecnie wersje zapoznawcze zwykle podążają za miesięcznym harmonogramem.
Important
Teraz dostępny jest nowy interfejs API do wnioskowania w wersji zapoznawczej. Dowiedz się więcej w naszym przewodniku cyklu życia interfejsu API.
| API | Najnowsza wersja zapoznawcza | Najnowsza wersja ogólnie dostępna | Specifications | Description |
|---|---|---|---|---|
| Płaszczyzna sterowania | 2025-07-01-preview |
2025-06-01 |
Pliki specyfikacji | Interfejs API płaszczyzny sterowania służy do wykonywania operacji, takich jak tworzenie zasobów, wdrażanie modelu i inne zadania zarządzania zasobami wyższego poziomu. Płaszczyzna sterowania decyduje również o możliwościach wykorzystania takich narzędzi, jak Azure Resource Manager, Bicep, Terraform i Azure CLI. |
| Płaszczyzna danych | v1 preview |
v1 |
Pliki specyfikacji | Interfejs API płaszczyzny danych nadzoruje procesy wnioskowania i tworzenia. |
Authentication
Usługa Azure OpenAI udostępnia dwie metody uwierzytelniania. Możesz użyć kluczy interfejsu API lub Microsoft Entra ID.
Uwierzytelnianie klucza interfejsu API: w przypadku tego typu uwierzytelniania wszystkie żądania interfejsu API muszą zawierać klucz interfejsu API w nagłówku
api-keyHTTP. Przewodnik Szybki start zawiera wskazówki dotyczące wykonywania wywołań przy użyciu tego typu uwierzytelniania.Uwierzytelnianie identyfikatora Entra firmy Microsoft: możesz uwierzytelnić wywołanie interfejsu API przy użyciu tokenu Entra firmy Microsoft. Tokeny uwierzytelniania są dołączane do żądania jako nagłówka
Authorization. Podany token musi być poprzedzony elementemBearer, na przykładBearer YOUR_AUTH_TOKEN. Możesz przeczytać nasz przewodnik z instrukcjami dotyczącymi uwierzytelniania za pomocą identyfikatora Entra firmy Microsoft.
Przechowywanie wersji interfejsu API REST
Interfejsy API usługi są wersjonowane za pomocą parametru api-version zapytania. Wszystkie wersje są zgodne ze strukturą dat RRRR-MM-DD. Przykład:
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
Wnioskowanie płaszczyzny danych
W pozostałej części artykułu omówiono 2025-04-01-preview wersję zapoznawczą specyfikacji wnioskowania płaszczyzny danych usługi Azure OpenAI.
Jeśli szukasz dokumentacji najnowszej wersji interfejsu API ga, zapoznaj się z najnowszym interfejsem API wnioskowania płaszczyzny danych ogólnie dostępnego
Uzupełnianie — tworzenie
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview
Tworzy uzupełnienie dla podanej podpowiedzi, parametrów i wybranego modelu.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| deployment-id | ścieżka | Yes | ciąg | |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| best_of | liczba całkowita | Generuje uzupełnienia best_of po stronie serwera i zwraca najlepszą (tę z najwyższym logarytmicznym prawdopodobieństwem na token). Nie można przesyłać strumieniowo wyników.W przypadku użycia z n, best_of kontroluje liczbę możliwych uzupełnień, a n określa, ile należy zwrócić – best_of musi być większe niż n.Uwaga: ponieważ ten parametr generuje wiele uzupełnień, może szybko wyczerpać przydział tokenów. Należy ostrożnie używać i upewnić się, że masz odpowiednie ustawienia dla max_tokens i stop. |
No | 1 |
| echo | boolean | Powtórz ponownie monit oprócz ukończenia | No | False |
| frequency_penalty | number | Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza. | No | 0 |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu. Akceptuje obiekt JSON, który mapuje tokeny (określone przez ich identyfikator tokenu w tokenizatorze GPT) do odpowiadającej wartości uprzedzenia od -100 do 100. Matematycznie stronniczy jest dodawany do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu. Na przykład możesz przekazać polecenie {"50256": -100} , aby zapobiec wygenerowaniu tokenu <|endoftext|> . |
No | None |
| logprobs | liczba całkowita | Uwzględnij logarytmiczne prawdopodobieństwa dla logprobs najbardziej prawdopodobnych tokenów wyjściowych oraz wybranych tokenów. Na przykład jeśli logprobs wartość to 5, interfejs API zwraca listę 5 najbardziej prawdopodobnych tokenów. Interfejs API zawsze zwraca logprob token próbki, więc w odpowiedzi może być maksymalnie logprobs+1 elementów.Maksymalna wartość parametru logprobs to 5. |
No | None |
| max_tokens | liczba całkowita | Maksymalna liczba tokenów, które można wygenerować w zakończeniu. Liczba tokenów zapytania plus max_tokens nie może przekraczać długości kontekstu modelu. |
No | 16 |
| n | liczba całkowita | Ile uzupełnień ma zostać wygenerowanych dla każdego polecenia. Uwaga: ponieważ ten parametr generuje wiele uzupełnień, może szybko wyczerpać przydział tokenów. Należy ostrożnie używać i upewnić się, że masz odpowiednie ustawienia dla max_tokens i stop. |
No | 1 |
| presence_penalty | number | Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy. | No | 0 |
| monit | ciąg lub tablica | Polecenie do wygenerowania uzupełnień zakodowane jako ciąg, tablica ciągów, tablica tokenów lub tablica tablicy tokenów. Należy pamiętać, że <|endoftext|> jest separatorem dokumentu, który model rozpoznaje podczas treningu, więc jeśli podpowiedź nie zostanie określona, model generuje tak, jakby od początku nowego dokumentu. |
Yes | |
| seed | liczba całkowita | Jeśli zostaną określone, nasz system dokłada wszelkich starań, aby próbkowanie deterministyczne sprawiało, że powtarzające się żądania z tymi samymi parametrami seed zwracają ten sam wynik.Determinizm nie jest gwarantowany i należy odwołać się do parametru odpowiedzi system_fingerprint w celu monitorowania zmian na serwerze. |
No | |
| stop | ciąg lub tablica | Maksymalnie cztery sekwencje, w których interfejs API przestaje generować kolejne tokeny. Zwrócony tekst nie będzie zawierać sekwencji zatrzymania. | No | |
| odtwarzać strumieniowo | boolean | Czy należy przesyłać strumieniowo częściowy postęp. W przypadku ustawienia tokeny są wysyłane jako zdarzenia wysyłane tylko do serwera, gdy staną się dostępne, a strumień zostanie zakończony komunikatem data: [DONE] .
Przykładowy kod języka Python. |
No | False |
| suffix | ciąg | Sufiks, który pojawia się po zakończeniu wstawionego tekstu. Ten parametr jest obsługiwany tylko dla programu gpt-3.5-turbo-instruct. |
No | None |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawiają, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawiają, że są bardziej skoncentrowane i deterministyczne. Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie. |
No | 1 |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie. |
No | 1 |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. |
No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | createCompletionResponse |
Kod stanu: wartość domyślna
Opis: Usługa niedostępna
| Content-Type | Type | Description |
|---|---|---|
| application/json | errorResponse |
Examples
Example
Tworzy uzupełnienie dla podanej podpowiedzi, parametrów i wybranego modelu.
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview
{
"prompt": [
"tell me a joke about mango"
],
"max_tokens": 32,
"temperature": 1.0,
"n": 1
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
"created": 1686617332,
"choices": [
{
"text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
"index": 0,
"finish_reason": "stop",
"logprobs": null
}
],
"usage": {
"completion_tokens": 20,
"prompt_tokens": 6,
"total_tokens": 26
}
}
}
Osadzanie — tworzenie
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview
Uzyskaj wektorową reprezentację danych wejściowych, które mogą być łatwo używane przez modele i algorytmy uczenia maszynowego.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| deployment-id | ścieżka | Yes | ciąg | Identyfikator wdrożenia wdrożonego modelu. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dimensions | liczba całkowita | Liczba wymiarów, które powinny mieć wynikowe osadzanie danych wyjściowych. Obsługiwane tylko w text-embedding-3 modelach i nowszych. |
No | |
| encoding_format | ciąg | Format, w jakim można zwrócić osadzenia. Może to być wartość float lub base64. Wartość domyślna to float. |
No | |
| dane wejściowe | ciąg lub tablica | Tekst wejściowy do osadzenia, zakodowany jako ciąg lub tablica tokenów. Aby osadzić wiele danych wejściowych w jednym żądaniu, przekaż tablicę ciągów lub tablicę tablic tokenów. Dane wejściowe nie mogą przekraczać maksymalnych tokenów wejściowych dla modelu (8192 tokenów dla text-embedding-ada-002), nie mogą być pustymi ciągami, a każda tablica musi mieć 2048 wymiarów lub mniej. |
Yes | |
| input_type | ciąg | typ wyszukiwania osadzania, którego chcesz użyć | No | |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. | No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | obiekt |
Examples
Example
Zwróć wektory osadzeń dla danego zapytania.
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview
{
"input": [
"this is a test"
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"data": [
{
"index": 0,
"embedding": [
-0.012838088,
-0.007421397,
-0.017617522,
-0.028278312,
-0.018666342,
0.01737855,
-0.01821495,
-0.006950092,
-0.009937238,
-0.038580645,
0.010674067,
0.02412286,
-0.013647936,
0.013189907,
0.0021125758,
0.012406612,
0.020790534,
0.00074595667,
0.008397198,
-0.00535031,
0.008968075,
0.014351576,
-0.014086051,
0.015055214,
-0.022211088,
-0.025198232,
0.0065186154,
-0.036350243,
0.009180495,
-0.009698266,
0.009446018,
-0.008463579,
-0.0020113448
]
}
],
"usage": {
"prompt_tokens": 4,
"total_tokens": 4
}
}
}
Ukończenie czatu — tworzenie
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
Tworzy uzupełnienie wiadomości na czacie
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| deployment-id | ścieżka | Yes | ciąg | |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| audio | obiekt | Parametry dla danych wyjściowych dźwięku. Wymagane przy żądaniu wyjścia audio za użyciem modalities: ["audio"]. |
No | |
| Format └─ | wyliczenie | Określa format dźwięku wyjściowego. Musi być jednym z wav, mp3, flac, opus lub pcm16. Możliwe wartości: wav, , mp3flac, , opuspcm16 |
No | |
| └─ głos | wyliczenie | Określa typ głosu. Obsługiwane głosy to alloy, echo, fable, onyx, nova i shimmer.Możliwe wartości: alloy, , echofable, onyx, , novashimmer |
No | |
| data_sources | macierz | Wpisy konfiguracji dla rozszerzeń czatu usługi Azure OpenAI, które ich używają. Ta dodatkowa specyfikacja jest zgodna tylko z usługą Azure OpenAI. |
No | |
| frequency_penalty | number | Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza. |
No | 0 |
| function_call | ciąg lub czatCompletionFunctionCallOption | Przestarzałe na rzecz tool_choice.Określa, która (jeśli istnieje) funkcja jest wywoływana przez model. none oznacza, że model nie wywoła funkcji, a zamiast tego generuje komunikat.auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem funkcji.Określenie określonej funkcji za pośrednictwem {"name": "my_function"} wymusza wywołanie tej funkcji przez model.none jest wartością domyślną, gdy nie ma żadnych funkcji.
auto jest wartością domyślną, jeśli funkcje są obecne. |
No | |
| functions | macierz | Przestarzałe na rzecz tools.Lista funkcji, dla których model może generować dane wejściowe JSON. |
No | |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu. Akceptuje obiekt JSON mapujący tokeny (określone przez ich identyfikator tokenu w tokenizatorze) na skojarzoną wartość stronniczą z zakresu od -100 do 100. Matematycznie stronniczy jest dodawany do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu. |
No | None |
| logprobs | boolean | Czy zwracać logarytmiczne prawdopodobieństwa dla tokenów wyjściowych, czy nie. Jeśli true, zwraca logarytmiczne prawdopodobieństwa każdego tokenu wyjściowego zwróconego w content elementu message. |
No | False |
| max_completion_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować na potrzeby ukończenia, w tym widoczne tokeny wyjściowe i tokeny rozumowania. | No | |
| max_tokens | liczba całkowita | Maksymalna liczba tokenów, które można wygenerować podczas kończenia czatu. Łączna długość tokenów wejściowych i wygenerowanych tokenów jest ograniczona przez długość kontekstu modelu. |
No | |
| messages | macierz | Lista wiadomości składających się z konwersacji do tej pory. Przykładowy kod języka Python. | Yes | |
| metadane | obiekt | Tagi i wartości zdefiniowane przez dewelopera używane do filtrowania uzupełniania na pulpicie nawigacyjnym przechowywanych uzupełniania. | No | |
| modalities | ChatCompletionModalities | Typy danych wyjściowych, które mają być generowane przez model dla tego żądania. Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną: ["text"]Model gpt-4o-audio-preview może również służyć do generowania dźwięku. Aby zażądać, aby ten model wygenerował odpowiedzi tekstowe i audio, możesz użyć:["text", "audio"] |
No | |
| n | liczba całkowita | Ile opcji ukończenia czatu ma być generowanych dla każdej wiadomości wejściowej. Opłaty będą naliczane na podstawie liczby wygenerowanych tokenów we wszystkich opcjach. Zachowaj n jako 1 aby zminimalizować koszty. |
No | 1 |
| parallel_tool_calls | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. | No | True |
| przewidywanie | PredictionContent | Konfiguracja przewidywanych danych wyjściowych, która może znacznie poprawić czas odpowiedzi, gdy duże części odpowiedzi modelu są znane z wyprzedzeniem. Jest to najbardziej typowe w przypadku ponownego generowania pliku z tylko drobnymi zmianami w większości zawartości. | No | |
| presence_penalty | number | Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy. |
No | 0 |
| reasoning_effort | wyliczenie |
Tylko modele o1 Ogranicza nakład pracy na rozumowanie modeli rozumowania. Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi.Możliwe wartości: low, , mediumhigh |
No | |
| response_format | ResponseFormatText lub ResponseFormatJsonObject lub ResponseFormatJsonSchema | Obiekt określający format, który musi zostać wygenerowany przez model. Zgodny z GPT-4o, GPT-4o mini, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo nowszymi niż gpt-3.5-turbo-1106.Ustawienie { "type": "json_schema", "json_schema": {...} } włącza dane wyjściowe ze strukturą, co gwarantuje zgodność modelu z podanym schematem JSON.Ustawienie { "type": "json_object" } włącza tryb JSON, co gwarantuje, że komunikat generowany przez model jest poprawnym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| seed | liczba całkowita | Ta funkcja jest dostępna w wersji beta. Jeśli zostaną określone, nasz system dokłada wszelkich starań, aby próbkowanie deterministyczne sprawiało, że powtarzające się żądania z tymi samymi parametrami seed zwracają ten sam wynik.Determinizm nie jest gwarantowany i należy odwołać się do parametru odpowiedzi system_fingerprint w celu monitorowania zmian na serwerze. |
No | |
| stop | ciąg lub tablica | Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny. |
No | |
| przechowywać | boolean | Niezależnie od tego, czy dane wyjściowe tego żądania ukończenia czatu mają być używane w naszych produktach destylacyjnych lub ewaluacyjnych modelu. | No | |
| odtwarzać strumieniowo | boolean | Jeśli zostanie ustawione, wysyłane są częściowe różnice komunikatów, na przykład w ChatGPT. Tokeny są wysyłane jako zdarzenia wysyłane tylko do serwera w miarę data: [DONE] ich dostępności, a strumień jest przerywany przez komunikat.
Przykładowy kod języka Python. |
No | False |
| stream_options | chatCompletionStreamOptions | Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true. |
No | None |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawiają, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawiają, że są bardziej skoncentrowane i deterministyczne. Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie. |
No | 1 |
| tool_choice | chatCompletionToolChoiceOption | Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie wywoła żadnego narzędzia, a zamiast tego generuje komunikat.
auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia.
required oznacza, że model musi wywoływać co najmniej jedno narzędzie. Określenie określonego narzędzia za pośrednictwem {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
none jest ustawieniem domyślnym, gdy żadne narzędzia nie są obecne.
auto jest wartością domyślną, jeśli istnieją narzędzia. |
No | |
| tools | macierz | Lista narzędzi, które model może wywołać. Obecnie tylko funkcje są obsługiwane jako narzędzie. Służy do udostępniania listy funkcji, dla których model może generować dane wejściowe JSON. Obsługiwane są maksymalnie 128 funkcji. |
No | |
| top_logprobs | liczba całkowita | Liczba całkowita z zakresu od 0 do 20 określająca liczbę najbardziej prawdopodobnych tokenów do zwrócenia na każdej pozycji, z których każdy ma skojarzone logarytmiczne prawdopodobieństwo.
logprobs musi być ustawione na true, jeśli ten parametr jest używany. |
No | |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie. |
No | 1 |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. |
No | |
| user_security_context | userSecurityContext | Kontekst zabezpieczeń użytkownika zawiera kilka parametrów opisujących samą aplikację sztucznej inteligencji oraz użytkownika końcowego, który wchodzi w interakcję z aplikacją sztucznej inteligencji. Te pola ułatwiają zespołom ds. operacji zabezpieczeń badanie i eliminowanie zdarzeń zabezpieczeń, zapewniając kompleksowe podejście do ochrony aplikacji sztucznej inteligencji. Dowiedz się więcej o ochronie aplikacji sztucznej inteligencji przy użyciu Microsoft Defender dla Chmury. | No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | obiekt |
Kod stanu: wartość domyślna
Opis: Usługa niedostępna
| Content-Type | Type | Description |
|---|---|---|
| application/json | errorResponse |
Examples
Example
Tworzy uzupełnienie dla podanej podpowiedzi, parametrów i wybranego modelu.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "system",
"content": "you are a helpful assistant that talks like a pirate"
},
{
"role": "user",
"content": "can you tell me how to care for a parrot?"
}
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Tworzy uzupełnienie w oparciu o dane z Azure Search oraz zarządzaną tożsamość przypisaną przez system.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"authentication": {
"type": "system_assigned_managed_identity"
}
}
}
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Tworzy uzupełnianie na podstawie danych wektorów obrazów usługi Azure Search.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"query_type": "vector",
"fields_mapping": {
"image_vector_fields": [
"image_vector"
]
},
"authentication": {
"type": "api_key",
"key": "{api key}"
}
}
}
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion."
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Tworzy uzupełnianie na podstawie danych wektora usługi Azure Search, poprzedniego komunikatu asystenta i tożsamości zarządzanej przypisanej przez użytkownika.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a cat?"
},
{
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"intent": "cat care"
}
},
{
"role": "user",
"content": "how about dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"authentication": {
"type": "user_assigned_managed_identity",
"managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
},
"index_name": "{index name}",
"query_type": "vector",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"in_scope": true,
"top_n_documents": 5,
"strictness": 3,
"role_information": "You are an AI assistant that helps people find information.",
"fields_mapping": {
"content_fields_separator": "\\n",
"content_fields": [
"content"
],
"filepath_field": "filepath",
"title_field": "title",
"url_field": "url",
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content 2.",
"title": "Citation Title 2",
"filepath": "contoso2.txt",
"url": "https://contoso.blob.windows.net/container/contoso2.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Tworzy ukończenie dla podanej usługi Azure Cosmos DB.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_cosmos_db",
"parameters": {
"authentication": {
"type": "connection_string",
"connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
},
"database_name": "vectordb",
"container_name": "azuredocs",
"index_name": "azuredocindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Tworzy ukończenie dla podanej bazy danych Mongo DB.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "mongo_db",
"parameters": {
"authentication": {
"type": "username_and_password",
"username": "<username>",
"password": "<password>"
},
"endpoint": "<endpoint_name>",
"app_name": "<application name>",
"database_name": "sampledb",
"collection_name": "samplecollection",
"index_name": "sampleindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Tworzy ukończenie dla podanego programu Elasticsearch.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "elasticsearch",
"parameters": {
"endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
"index_name": "{index name}",
"authentication": {
"type": "key_and_key_id",
"key": "{key}",
"key_id": "{key id}"
}
}
}
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Tworzy ukończenie dla podanego zasobu Pinecone.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "pinecone",
"parameters": {
"authentication": {
"type": "api_key",
"key": "{api key}"
},
"environment": "{environment name}",
"index_name": "{index name}",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"title_field": "title",
"url_field": "url",
"filepath_field": "filepath",
"content_fields": [
"content"
],
"content_fields_separator": "\n"
}
}
}
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Transkrypcje — tworzenie
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
Transkrybuje dźwięk w języku wejściowym.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| deployment-id | ścieżka | Yes | ciąg | |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: dane wielu części/formularzu
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| model | ciąg | Identyfikator modelu do użycia. Opcje to gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1, i gpt-4o-transcribe-diarize. |
Yes | |
| plik | ciąg | Obiekt pliku audio do transkrypcji. | Yes | |
| język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 zwiększa dokładność i opóźnienie. | No | |
| monit | ciąg | Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Komunikat powinien być zgodny z językiem dźwięku. | No | |
| response_format | audioResponseFormat | Definiuje format danych wyjściowych. | No | |
| temperature | number | Temperatura próbkowania z zakresu od 0 do 1. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Jeśli ustawiono wartość 0, model używa log prawdopodobieństwa, aby automatycznie zwiększyć temperaturę, aż do momentu, gdy przekroczy określone progi. | No | 0 |
| timestamp_granularities[] | macierz | Stopień szczegółowości sygnatury czasowej do wypełnienia dla tej transkrypcji.
response_format należy ustawić, verbose_json aby używać szczegółowości sygnatury czasowej. Obsługiwane są obie te opcje: word, lub segment. Uwaga: nie ma dodatkowego opóźnienia dla znaczników czasu segmentu, ale generowanie znaczników czasu dla wyrazów powoduje dodatkowe opóźnienie. |
No | ['segment'] |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | obiekt | |
| text/plain | ciąg | Transkrybowany tekst w formacie wyjściowym (gdy response_format była jedną z wartości text, vtt lub srt). |
Examples
Example
Pobiera transkrybowany tekst i powiązane metadane z dostarczonych danych dźwiękowych.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
Pobiera transkrybowany tekst i powiązane metadane z dostarczonych danych dźwiękowych.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Odpowiedzi: Kod stanu: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Tłumaczenia — tworzenie
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
Transkrybuje i tłumaczy dźwięk wejściowy na tekst w języku angielskim.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| deployment-id | ścieżka | Yes | ciąg | |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: dane wielu części/formularzu
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| plik | ciąg | Plik audio do tłumaczenia. | Yes | |
| monit | ciąg | Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Monit powinien być w języku angielskim. | No | |
| response_format | audioResponseFormat | Definiuje format danych wyjściowych. | No | |
| temperature | number | Temperatura próbkowania z zakresu od 0 do 1. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Jeśli ustawiono wartość 0, model używa log prawdopodobieństwa, aby automatycznie zwiększyć temperaturę, aż do momentu, gdy przekroczy określone progi. | No | 0 |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | obiekt | |
| text/plain | ciąg | Transkrypcja tekstu w formacie wyjściowym (gdy format_odpowiedzi był jednym z tekstu, vtt lub srt). |
Examples
Example
Pobiera transkrybowany tekst w języku angielskim i skojarzone metadane z dostarczonych danych dźwiękowych mówionych.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Odpowiedzi: Kod stanu: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
Pobiera transkrybowany tekst w języku angielskim i skojarzone metadane z dostarczonych danych dźwiękowych mówionych.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Odpowiedzi: Kod stanu: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Mowa — tworzenie
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
Generuje dźwięk z tekstu wejściowego.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| deployment-id | ścieżka | Yes | ciąg | |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: dane wielu części/formularzu
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane wejściowe | ciąg | Tekst do syntezowania dźwięku. Maksymalna długość to 4096 znaków. | Yes | |
| response_format | wyliczenie | Format syntetyzowania dźwięku. Możliwe wartości: mp3, , opusaac, flac, , wavpcm |
No | |
| speed | number | Szybkość syntetyzowanego dźwięku. Wybierz wartość z 0.25 do 4.0.
1.0 jest wartością domyślną. |
No | 1.0 |
| voice | wyliczenie | Głos używany do syntezy mowy. Możliwe wartości: alloy, , echofable, onyx, , novashimmer |
Yes |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/octet-stream | ciąg |
Examples
Example
Syntetyzuje dźwięk z dostarczonego tekstu.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
{
"input": "Hi! What are you going to make?",
"voice": "fable",
"response_format": "mp3"
}
Odpowiedzi: Kod stanu: 200
{
"body": "101010101"
}
Generacje obrazów — tworzenie
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
Generuje zestaw obrazów na podstawie opisu tekstowego dla określonego wdrożenia modelu z serii DALL-E lub gpt-image-1
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| deployment-id | ścieżka | Yes | ciąg | |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| tło | imageBackground | Umożliwia ustawienie przezroczystości tła wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1. | No | auto |
| n | liczba całkowita | Liczba obrazów do wygenerowania. Obsługiwane jest tylko n=1 dla dall-e-3. | No | 1 |
| output_compression | liczba całkowita | Poziom kompresji (0–100%) dla wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1 z formatem danych wyjściowych jpeg. | No | 100 |
| output_format | imagesOutputFormat | Format pliku, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko w przypadku modeli serii gpt-image-1. | No | png |
| monit | ciąg | Opis tekstu żądanych obrazów. Maksymalna długość to 32000 znaków dla serii gpt-image-1 i 4000 znaków dla dall-e-3 | Yes | |
| partial_images | liczba całkowita | Liczba częściowych obrazów do wygenerowania. Ten parametr jest używany do przesyłania strumieniowego odpowiedzi, które zwracają częściowe obrazy. Wartość musi należeć do przedziału od 0 do 3. Po ustawieniu wartości 0 odpowiedź będzie zawierać pojedynczy obraz wysłany w jednym zdarzeniu przesyłania strumieniowego. Należy pamiętać, że ostateczny obraz może zostać wysłany przed wygenerowaniem pełnej liczby obrazów częściowych, jeśli pełny obraz zostanie wygenerowany szybciej. | 0 | |
| odtwarzać strumieniowo | boolean | Edytuj obraz w trybie przesyłania strumieniowego. | no | false |
| quality | imageQuality | Jakość obrazu, który zostanie wygenerowany. | No | auto |
| response_format | imagesResponseFormat | Format, w którym są zwracane wygenerowane obrazy. Ten parametr nie jest obsługiwany w przypadku gpt-image-1modeli serii , które zawsze będą zwracać obrazy zakodowane w formacie base64.Możliwe wartości: url, b64_json. |
No | url |
| size | imageSize | Rozmiar wygenerowanych obrazów. | No | auto |
| styl | imageStyle | Styl wygenerowanych obrazów. Obsługiwane tylko dla dall-e-3. | No | vivid |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. | No |
Responses
Kod stanu: 200
Opis: Ok
| Content-Type | Type | Description |
|---|---|---|
| application/json | generateImagesResponse |
Kod stanu: wartość domyślna
Opis: Wystąpił błąd.
| Content-Type | Type | Description |
|---|---|---|
| application/json | dalleErrorResponse |
Examples
Example
Tworzy obrazy z monitem.
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"created": 1698342300,
"data": [
{
"revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
"prompt_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
},
"profanity": {
"detected": false,
"filtered": false
},
"custom_blocklists": {
"filtered": false,
"details": []
}
},
"url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
"content_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
}
}
}
]
}
}
Generacje obrazów — edycja
POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview
Edytuje obraz z tekstowego podpisu w ramach danego wdrożenia modelu gpt-image-1
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| deployment-id | ścieżka | Yes | ciąg | |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: dane wielu części/formularzu
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| obraz | ciąg lub tablica | Obrazy do edycji. Musi być obsługiwanym plikiem obrazu lub tablicą obrazów. Każdy obraz powinien być plikiem png lub jpg mniejszym niż 50 MB. | Yes | |
| input_fidelity | ciąg | Kontroluj, ile wysiłku model podejmie, aby dopasować styl i cechy, zwłaszcza cechy twarzy, obrazów wejściowych. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1. Obsługuje high i low. |
no |
low. |
| maska | ciąg | Dodatkowy obraz, którego w pełni przezroczyste obszary (np. alfa ma wartość zero) wskazują, gdzie ma być edytowany obraz. Jeśli dostępnych jest wiele obrazów, maska zostanie zastosowana do pierwszego obrazu. Musi być prawidłowym plikiem PNG, mniejszym niż 4 MB i mieć takie same wymiary jak obraz. | No | |
| n | liczba całkowita | Liczba obrazów do wygenerowania. Musi należeć do zakresu od 1 do 10. | No | 1 |
| monit | ciąg | Opis tekstu żądanych obrazów. Maksymalna długość to 32000 znaków. | Yes | |
| quality | imageQuality | Jakość obrazu, który zostanie wygenerowany. | No | auto |
| partial_images | Liczba częściowych obrazów do wygenerowania. Ten parametr jest używany do przesyłania strumieniowego odpowiedzi, które zwracają częściowe obrazy. Wartość musi należeć do przedziału od 0 do 3. Po ustawieniu wartości 0 odpowiedź będzie zawierać pojedynczy obraz wysłany w jednym zdarzeniu przesyłania strumieniowego. Należy pamiętać, że ostateczny obraz może zostać wysłany przed wygenerowaniem pełnej liczby obrazów częściowych, jeśli pełny obraz zostanie wygenerowany szybciej. | |||
| odtwarzać strumieniowo | boolean | Edytuj obraz w trybie przesyłania strumieniowego. | no | false |
| response_format | imagesResponseFormat | Format, w którym są zwracane wygenerowane obrazy. | No | url |
| size | imageSize | Rozmiar wygenerowanych obrazów. | No | auto |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. | No |
Responses
Kod stanu: 200
Opis: Ok
| Content-Type | Type | Description |
|---|---|---|
| application/json | generateImagesResponse |
Kod stanu: wartość domyślna
Opis: Wystąpił błąd.
| Content-Type | Type | Description |
|---|---|---|
| application/json | dalleErrorResponse |
Lista — Asystenci
GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
Zwraca listę asystentów.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| limit | kwerenda | No | liczba całkowita | Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc w przypadku kolejności rosnącej i desc kolejności malejącej. |
| after | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy. |
| before | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | listAssistantsResponse |
Examples
Example
Zwraca listę asystentów.
GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "asst_abc123",
"object": "assistant",
"created_at": 1707257477,
"name": "Stock Analyst",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc456",
"object": "assistant",
"created_at": 1698982718,
"name": "My Assistant",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant designed to make me better at coding!",
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc789",
"object": "assistant",
"created_at": 1698982643,
"name": null,
"description": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
],
"first_id": "asst_abc123",
"last_id": "asst_abc789",
"has_more": false
}
}
Tworzenie — Asystent
POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
Utwórz asystenta przy użyciu modelu i instrukcji.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| description | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
No | |
| instructions | ciąg | Instrukcje systemowe używane przez asystenta. Maksymalna długość to 256 000 znaków. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| model | ciąg | Yes | ||
| name | ciąg | Nazwa asystenta. Maksymalna długość to 256 znaków. |
No | |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta. |
No | |
| └─ przechowalnie_wektorów | macierz | Pomocnik do tworzenia magazynu wektorów z file_ids i dołączania go do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta. |
No | |
| tools | macierz | Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, retrievallub function. |
No | [] |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu. |
No | 1 |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | assistantObject |
Examples
Example
Utwórz asystenta przy użyciu modelu i instrukcji.
POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
{
"name": "Math Tutor",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"model": "gpt-4-1106-preview"
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant",
"created_at": 1707295707,
"name": "Math Tutor",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
Pobierz — Asystent
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Pobiera asystenta.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| assistant_id | ścieżka | Yes | ciąg | Identyfikator asystenta do pobrania. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | assistantObject |
Examples
Example
Pobiera asystenta.
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "asst_abc123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
"tools": [
{
"type": "file_search"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
Modyfikowanie — Asystent
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Modyfikuje asystenta.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| assistant_id | ścieżka | Yes | ciąg | Identyfikator asystenta, który należy zmodyfikować. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| description | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
No | |
| instructions | ciąg | Instrukcje systemowe używane przez asystenta. Maksymalna długość to 32768 znaków. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| model | ciąg | No | ||
| name | ciąg | Nazwa asystenta. Maksymalna długość to 256 znaków. |
No | |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Zastępuje listę identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Zastępuje magazyn wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta. |
No | |
| tools | macierz | Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, retrievallub function. |
No | [] |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu. |
No | 1 |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | assistantObject |
Examples
Example
Modyfikuje asystenta.
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
{
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"model": "gpt-4-turbo"
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "asst_123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": []
}
},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
Usuwanie — Asystent
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Usuń asystenta.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| assistant_id | ścieżka | Yes | ciąg | Identyfikator asystenta do usunięcia. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | deleteAssistantResponse |
Examples
Example
Usuwa asystenta.
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant.deleted",
"deleted": true
}
}
Tworzenie — wątek
POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview
Utwórz wątek.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| messages | macierz | Lista komunikatów, z których chcesz rozpocząć wątek. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| tool_resources | obiekt | Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku. |
No | |
| └─ przechowalnie_wektorów | macierz | Pomocnik do tworzenia magazynu wektorów z file_ids i dołączania go do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku. |
No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | threadObject |
Examples
Example
Tworzy wątek.
POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {}
}
}
Pobierz — wątek
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Pobiera wątek.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątku do pobrania. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | threadObject |
Examples
Example
Pobiera wątek.
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {},
"tool_resources": {
"code_interpreter": {
"file_ids": []
}
}
}
}
Modyfikuj — wątek
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Modyfikuje wątek.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątku do zmodyfikowania. Można modyfikować tylko metadata. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| tool_resources | obiekt | Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku. |
No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | threadObject |
Examples
Example
Modyfikuje wątek.
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {
"modified": "true",
"user": "abc123"
},
"tool_resources": {}
}
}
Usuwanie — wątek
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Usuń wątek.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątku do usunięcia. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | deleteThreadResponse |
Examples
Example
Usuwa wątek.
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread.deleted",
"deleted": true
}
}
Lista — komunikaty
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
Zwraca listę komunikatów dla danego wątku.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątków, do których należą komunikaty. |
| limit | kwerenda | No | liczba całkowita | Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc w przypadku kolejności rosnącej i desc kolejności malejącej. |
| after | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy. |
| before | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy. |
| run_id | kwerenda | No | ciąg | Filtruj komunikaty według identyfikatora przebiegu, który je wygenerował. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | listMessagesResponse |
Examples
Example
Wyświetlanie listy komunikatów
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
},
{
"id": "msg_abc456",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "Hello, what is AI?",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
],
"first_id": "msg_abc123",
"last_id": "msg_abc456",
"has_more": false
}
}
Tworzenie — komunikat
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
Utwórz wiadomość.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątków, dla których należy utworzyć wiadomość. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| attachments | macierz | Lista plików dołączonych do wiadomości oraz narzędzia, do których należy je dodać. | No | |
| zawartość | ciąg | Zawartość wiadomości. | Yes | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| rola | ciąg | Rola jednostki tworzącej komunikat. Dozwolone wartości obejmują: - user: wskazuje, że komunikat jest wysyłany przez rzeczywistego użytkownika i powinien być używany w większości przypadków do reprezentowania komunikatów generowanych przez użytkownika.- assistant: wskazuje, że komunikat jest generowany przez asystenta. Użyj tej wartości, aby wstawić wiadomości z asystenta do konwersacji. |
Yes |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | messageObject |
Examples
Example
Utwórz wiadomość.
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
{
"role": "user",
"content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"assistant_id": null,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
}
Pobierz — komunikat
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
Pobieranie komunikatu.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątków, do których należy ten komunikat. |
| message_id | ścieżka | Yes | ciąg | Identyfikator wiadomości do pobrania. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | messageObject |
Examples
Example
Pobieranie komunikatu.
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"file_ids": [],
"assistant_id": null,
"run_id": null,
"metadata": {}
}
}
Modyfikuj — komunikat
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
Modyfikuje komunikat.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątku, do którego należy ten komunikat. |
| message_id | ścieżka | Yes | ciąg | Identyfikator wiadomości do zmodyfikowania. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | messageObject |
Examples
Example
Zmodyfikuj komunikat.
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699017614,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"file_ids": [],
"metadata": {
"modified": "true",
"user": "abc123"
}
}
}
Tworzenie — wątek i uruchamianie
POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview
Utwórz wątek i uruchom go w jednym żądaniu.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| assistant_id | ciąg | Identyfikator asystenta do wykonania tego przebiegu. | Yes | |
| instructions | ciąg | Zastąpi domyślny komunikat systemowy asystenta. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia, które mogą być używane w trakcie przebiegu. Uruchomienie dokłada wszelkich starań, aby używać tylko określonej liczby tokenów ukończenia w wielu etapach uruchomienia. Jeśli przebieg przekroczy określoną liczbę tokenów ukończenia, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details. |
No | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów monitów, które mogą być używane w trakcie przebiegu. Przebieg dokłada wszelkich starań, aby używać tylko określonej liczby tokenów monitu podczas wielu cykli przebiegu. Jeśli przebieg przekroczy określoną liczbę tokenów monitu, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| model | ciąg | Identyfikator modeli, które mają być wykorzystane do wykonania tego zadania. Jeśli w tym miejscu zostanie podana wartość, zastąpi ona model skojarzony z asystentem. Jeśli nie, zostanie użyty model skojarzony z asystentem. | No | |
| parallel_tool_calls | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. | No | True |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| odtwarzać strumieniowo | boolean | Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] . |
No | |
| stream_options | chatCompletionStreamOptions | Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true. |
No | None |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. |
No | 1 |
| konwersacja | createThreadRequest | No | ||
| tool_choice | assistantsApiToolChoiceOption | Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.none oznacza, że model nie wywołuje żadnych narzędzi, a zamiast tego generuje komunikat.auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model. |
No | |
| tool_resources | obiekt | Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Identyfikator magazynu wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta. |
No | |
| tools | macierz | Zastąpić narzędzia, których asystent może użyć na potrzeby tego przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. | No | |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu. |
No | 1 |
| truncation_strategy | truncationObject | Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. | No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | runObject |
Examples
Example
Utwórz wątek i uruchom go w jednym żądaniu.
POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview
{
"assistant_id": "asst_abc123",
"thread": {
"messages": [
{
"role": "user",
"content": "Explain deep learning to a 5 year old."
}
]
}
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076792,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": null,
"expires_at": 1699077392,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"required_action": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant.",
"tools": [],
"tool_resources": {},
"metadata": {},
"temperature": 1.0,
"top_p": 1.0,
"max_completion_tokens": null,
"max_prompt_tokens": null,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"incomplete_details": null,
"usage": null,
"response_format": "auto",
"tool_choice": "auto"
}
}
Lista — uruchomienia
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
Zwraca listę przebiegów należących do wątku.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątku, do którego należy przebieg. |
| limit | kwerenda | No | liczba całkowita | Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc w przypadku kolejności rosnącej i desc kolejności malejącej. |
| after | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy. |
| before | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | listRunsResponse |
Examples
Example
Zwraca listę przebiegów należących do wątku.
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
},
{
"id": "run_abc456",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
],
"first_id": "run_abc123",
"last_id": "run_abc456",
"has_more": false
}
}
Tworzenie — uruchamianie
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
Utwórz przebieg.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątku do uruchomienia. |
| include[] | kwerenda | No | macierz | Lista dodatkowych pól do uwzględnienia w odpowiedzi. Obecnie jedyną obsługiwaną wartością jest step_details.tool_calls[*].file_search.results[*].content, aby pobrać zawartość wyników wyszukiwania pliku. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| additional_instructions | ciąg | Dołącza dodatkowe instrukcje na końcu instrukcji dotyczących przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów bez zastępowania innych instrukcji. | No | |
| additional_messages | macierz | Dodaje dodatkowe komunikaty do wątku przed utworzeniem przebiegu. | No | |
| assistant_id | ciąg | Identyfikator asystenta do wykonania tego przebiegu. | Yes | |
| instructions | ciąg | Zastąpi domyślny komunikat systemowy asystenta. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia, które mogą być używane w trakcie przebiegu. Uruchomienie dokłada wszelkich starań, aby używać tylko określonej liczby tokenów ukończenia w wielu etapach uruchomienia. Jeśli przebieg przekroczy określoną liczbę tokenów ukończenia, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details. |
No | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów monitów, które mogą być używane w trakcie przebiegu. Przebieg dokłada wszelkich starań, aby używać tylko określonej liczby tokenów monitu podczas wielu cykli przebiegu. Jeśli przebieg przekroczy określoną liczbę tokenów monitu, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| model | ciąg | Identyfikator modelu, który ma być używany do wykonania tego przebiegu. Jeśli w tym miejscu zostanie podana wartość, zastąpi ona model skojarzony z asystentem. Jeśli nie, zostanie użyty model skojarzony z asystentem. | No | |
| parallel_tool_calls | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. | No | True |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| odtwarzać strumieniowo | boolean | Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] . |
No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. |
No | 1 |
| tool_choice | assistantsApiToolChoiceOption | Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.none oznacza, że model nie wywołuje żadnych narzędzi, a zamiast tego generuje komunikat.auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model. |
No | |
| tools | macierz | Zastąpić narzędzia, których asystent może użyć na potrzeby tego przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. | No | |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu. |
No | 1 |
| truncation_strategy | truncationObject | Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. | No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | runObject |
Examples
Example
Utwórz przebieg.
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
{
"assistant_id": "asst_abc123"
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
Pobierz — uruchamianie
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
Pobiera przebieg.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator uruchomionych wątków. |
| run_id | ścieżka | Yes | ciąg | Identyfikator przebiegu do pobrania. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | runObject |
Examples
Example
Pobiera przebieg.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
"object": "thread.run",
"created_at": 1707303196,
"assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
"thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
"status": "completed",
"started_at": 1707303197,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1707303201,
"last_error": null,
"model": "gpt-4-1106-preview",
"instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
"tools": [],
"file_ids": [],
"metadata": {}
}
}
Modyfikowanie — uruchamianie
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
Modyfikuje przebieg.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator uruchomionych wątków. |
| run_id | ścieżka | Yes | ciąg | Identyfikator uruchomienia do zmodyfikowania. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | runObject |
Examples
Example
Modyfikuje przebieg.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
{
"metadata": {
"user_id": "user_abc123"
}
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {
"user_id": "user_abc123"
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
Przesyłanie — dane wyjściowe narzędzia do uruchomienia
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview
Gdy przebieg ma status: "requires_action" wartość i required_action.type to submit_tool_outputs, ten punkt końcowy może służyć do przesyłania danych wyjściowych z wywołań narzędzia po ich zakończeniu. Wszystkie dane wyjściowe muszą zostać przesłane w jednym żądaniu.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątków, do których należy to uruchomienie. |
| run_id | ścieżka | Yes | ciąg | Identyfikator przebiegu, który wymaga przesłania raportu z działania narzędzia. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| odtwarzać strumieniowo | boolean | Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] . |
No | |
| tool_outputs | macierz | Lista narzędzi, dla których są przesyłane dane wyjściowe. | Yes |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | runObject |
Examples
Example
Gdy przebieg ma status: "requires_action" wartość i required_action.type to submit_tool_outputs, ten punkt końcowy może służyć do przesyłania danych wyjściowych z wywołań narzędzia po ich zakończeniu. Wszystkie dane wyjściowe muszą zostać przesłane w jednym żądaniu.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview
{
"tool_outputs": [
{
"tool_call_id": "call_001",
"output": "70 degrees and sunny."
}
]
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "run_123",
"object": "thread.run",
"created_at": 1699075592,
"assistant_id": "asst_123",
"thread_id": "thread_123",
"status": "queued",
"started_at": 1699075592,
"expires_at": 1699076192,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [
{
"type": "function",
"function": {
"name": "get_current_weather",
"description": "Get the current weather in a given location",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA"
},
"unit": {
"type": "string",
"enum": [
"celsius",
"fahrenheit"
]
}
},
"required": [
"location"
]
}
}
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
Anulowanie — uruchamianie
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview
Anuluje przebieg, który ma wartość in_progress.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątku, do którego należy to uruchomienie. |
| run_id | ścieżka | Yes | ciąg | Identyfikator uruchomienia do anulowania. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | runObject |
Examples
Example
Anuluje przebieg, który ma wartość in_progress.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076126,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "cancelling",
"started_at": 1699076126,
"expires_at": 1699076726,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You summarize books.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": [
"vs_123"
]
}
},
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"response_format": "auto"
}
}
Lista — kroki uruchamiania
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview
Zwraca listę kroków uruchamiania należących do przebiegu.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątku, do którego należy uruchomienie i kroki uruchamiania. |
| run_id | ścieżka | Yes | ciąg | Identyfikator przebiegu, do którego należą kroki uruchamiania. |
| limit | kwerenda | No | liczba całkowita | Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc w przypadku kolejności rosnącej i desc kolejności malejącej. |
| after | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy. |
| before | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy. |
| api-version | kwerenda | Yes | ciąg | |
| include[] | kwerenda | No | macierz | Lista dodatkowych pól do uwzględnienia w odpowiedzi. Obecnie jedyną obsługiwaną wartością jest step_details.tool_calls[*].file_search.results[*].content, aby pobrać zawartość wyników wyszukiwania pliku. |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | listRunStepsResponse |
Examples
Example
Zwraca listę kroków uruchamiania należących do przebiegu.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
],
"first_id": "step_abc123",
"last_id": "step_abc456",
"has_more": false
}
}
Pobieranie — krok uruchamiania
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview
Pobiera krok uruchomienia.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| thread_id | ścieżka | Yes | ciąg | Identyfikator wątku, do którego należy uruchomienie i krok uruchomienia. |
| run_id | ścieżka | Yes | ciąg | Identyfikator przebiegu, do którego należy krok uruchamiania. |
| step_id | ścieżka | Yes | ciąg | Identyfikator etapu procesu do pobrania. |
| include[] | kwerenda | No | macierz | Lista dodatkowych pól do uwzględnienia w odpowiedzi. Obecnie jedyną obsługiwaną wartością jest step_details.tool_calls[*].file_search.results[*].content, aby pobrać zawartość wyników wyszukiwania pliku. |
| api-version | kwerenda | Yes | ciąg |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | runStepObject |
Examples
Example
Pobiera krok uruchomienia.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
}
Lista — magazyny wektorowe
GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
Zwraca listę magazynów wektorów.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| limit | kwerenda | No | liczba całkowita | Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc w przypadku kolejności rosnącej i desc kolejności malejącej. |
| after | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy. |
| before | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | listVectorStoresResponse |
Examples
Example
Zwraca listę magazynów wektorów.
GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
},
{
"id": "vs_abc456",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ v2",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
],
"first_id": "vs_abc123",
"last_id": "vs_abc456",
"has_more": false
}
}
Tworzenie — magazyn wektorów
POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
Utwórz magazyn wektorów.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunking_strategy | autoChunkingStrategyRequestParam lub staticChunkingStrategyRequestParam | Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. Dotyczy tylko wtedy, gdy file_ids nie jest pusty. |
No | |
| expires_after | vectorStoreExpirationAfter | Zasady wygasania magazynu wektorów. | No | |
| file_ids | macierz | Lista identyfikatorów plików, których powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| name | ciąg | Nazwa magazynu wektorów. | No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | vectorStoreObject |
Examples
Example
Tworzy magazyn wektorów.
POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
Pobieranie — magazyn wektorów
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Pobiera magazyn wektorów.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów do pobrania. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | vectorStoreObject |
Examples
Example
Pobiera magazyn wektorów.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776
}
}
Modyfikuj — magazyn wektorów
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Modyfikuje magazyn wektorów.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów do zmodyfikowania. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| expires_after | vectorStoreExpirationAfter | Zasady wygasania magazynu wektorów. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| name | ciąg | Nazwa magazynu wektorów. | No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | vectorStoreObject |
Examples
Example
Modyfikuje magazyn wektorów.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
{
"name": "Support FAQ"
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
Usuwanie — magazyn wektorów
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Usuń magazyn wektorów.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów do usunięcia. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | deleteVectorStoreResponse |
Examples
Example
Usuwa magazyn wektorów.
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store.deleted",
"deleted": true
}
}
Lista — pliki magazynu wektorowego
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
Zwraca listę plików magazynu wektorowego.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów, do którego należą pliki. |
| limit | kwerenda | No | liczba całkowita | Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc w przypadku kolejności rosnącej i desc kolejności malejącej. |
| after | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy. |
| before | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy. |
| filtr | kwerenda | No | ciąg Możliwe wartości: in_progress, , completed, failedcancelled |
Filtruj według stanu pliku. Jeden z in_progress, completed, failed, cancelled. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | listVectorStoreFilesResponse |
Examples
Example
Zwraca listę plików magazynu wektorowego.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
Tworzenie — plik magazynu wektorów
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
Utwórz plik magazynu wektorów, dołączając plik do magazynu wektorów.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów, dla którego ma zostać utworzony plik. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunking_strategy | chunkingStrategyRequestParam | Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. |
No | |
| file_id | ciąg | Identyfikator pliku, którego powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. |
Yes |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | vectorStoreFileObject |
Examples
Example
Utwórz plik magazynu wektorów, dołączając plik do magazynu wektorów.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
{
"file_id": "file-abc123"
}
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"usage_bytes": 1234,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
Get — plik magazynu wektorów
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Pobiera plik magazynu wektorów.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów, do którego należy plik. |
| file_id | ścieżka | Yes | ciąg | Identyfikator pobieranego pliku. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | vectorStoreFileObject |
Examples
Example
Pobiera plik magazynu wektorów.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
Usuwanie — plik magazynu wektorowego
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Usuń plik magazynu wektorów. Spowoduje to usunięcie pliku z magazynu wektorów, ale sam plik nie zostanie usunięty. Aby usunąć plik, użyj punktu końcowego usuwania pliku.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów, do którego należy plik. |
| file_id | ścieżka | Yes | ciąg | Identyfikator pliku do usunięcia. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | deleteVectorStoreFileResponse |
Examples
Example
Usuń plik magazynu wektorów. Spowoduje to usunięcie pliku z magazynu wektorów, ale sam plik nie zostanie usunięty. Aby usunąć plik, użyj punktu końcowego usuwania pliku.
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "file_abc123",
"object": "vector_store.file.deleted",
"deleted": true
}
}
Updatevectorstorefileattributes
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Zaktualizuj atrybuty w pliku wektorowym.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów, do którego należy plik. |
| file_id | ścieżka | Yes | ciąg | Identyfikator pliku do zaktualizowania atrybutów. |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| attributes | VectorStoreFileAttributes | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości logiczne lub liczby. |
Yes |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | vectorStoreFileObject |
Pobierz zawartość pliku magazynu wektorów
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}/content?api-version=2025-04-01-preview
Pobierz przeanalizowaną zawartość pliku repozytorium wektorów.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów. |
| file_id | ścieżka | Yes | ciąg | ID pliku w magazynie wektorów. |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | VectorStoreFileContentResponse |
Repozytorium wektorów wyszukiwania
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/search?api-version=2025-04-01-preview
Przeszukaj magazyn wektorów pod kątem odpowiednich fragmentów na podstawie filtru atrybutów zapytania i pliku.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów do wyszukiwania. |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| filters | Filtr porównawczy lub filtr złożony | Filtr do zastosowania na podstawie atrybutów pliku. | No | |
| max_num_results | liczba całkowita | Maksymalna liczba wyników do zwrócenia. Ta liczba powinna należeć do zakresu od 1 do 50 włącznie. | No | 10 |
| kwerenda | ciąg lub tablica | Ciąg zapytania dla wyszukiwania | Yes | |
| ranking_options | obiekt | Opcje klasyfikacji wyszukiwania. | No | |
| └} ranker | wyliczenie | Możliwe wartości: auto, default-2024-11-15 |
No | |
| └─ próg_punktowy | number | No | 0 | |
| rewrite_query | boolean | Określa, czy należy ponownie napisać zapytanie języka naturalnego na potrzeby wyszukiwania wektorów. | No | False |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | VectorStoreSearchResultsPage |
Tworzenie — wektorowa partia plików magazynu
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview
Utwórz wektorową partię plików magazynu.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów, dla którego ma zostać utworzona partia plików. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunking_strategy | chunkingStrategyRequestParam | Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. |
No | |
| file_ids | macierz | Lista identyfikatorów plików, których powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. |
Yes |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | vectorStoreFileBatchObject |
Examples
Example
Utwórz wektorową partię plików magazynu.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview
{
"file_ids": [
"file-abc123",
"file-abc456"
]
}
Odpowiedzi: Kod stanu: 200
{
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
Get — wektorowa partia plików magazynu
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview
Pobiera wektorową partię plików magazynu.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów, do którego należy partia plików. |
| batch_id | ścieżka | Yes | ciąg | Identyfikator pobieranej partii plików. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | vectorStoreFileBatchObject |
Examples
Example
Pobiera wektorową partię plików magazynu.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
}
Anulowanie — wektorowy magazyn plików wsadowy
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview
Anuluj partię plików magazynu wektorów. Spowoduje to jak najszybsze anulowanie przetwarzania plików w tej partii.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów, do którego należy partia plików. |
| batch_id | ścieżka | Yes | ciąg | Identyfikator partii plików, którą należy anulować. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | vectorStoreFileBatchObject |
Examples
Example
Anuluj partię plików magazynu wektorów. Spowoduje to jak najszybsze anulowanie przetwarzania plików w tej partii.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "cancelling",
"file_counts": {
"in_progress": 12,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 15
}
}
}
Lista — pliki wsadowe magazynu wektorów
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview
Zwraca listę plików magazynu wektorów w partii.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| vector_store_id | ścieżka | Yes | ciąg | Identyfikator magazynu wektorów, do którego należą pliki. |
| batch_id | ścieżka | Yes | ciąg | Identyfikator partii plików, do którego należą pliki. |
| limit | kwerenda | No | liczba całkowita | Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc w przypadku kolejności rosnącej i desc kolejności malejącej. |
| after | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy. |
| before | kwerenda | No | ciąg | Kursor do użycia w stronicowaniu.
before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy. |
| filtr | kwerenda | No | ciąg Możliwe wartości: in_progress, , completed, failedcancelled |
Filtruj według stanu pliku. Jeden z in_progress, completed, failed, cancelled. |
| api-version | kwerenda | Yes | ciąg | wersja interfejsu API |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | listVectorStoreFilesResponse |
Examples
Example
Zwraca listę plików magazynu wektorowego.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview
Odpowiedzi: Kod stanu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
Tworzenie — Realtimesession
POST https://{endpoint}/openai/realtimeapi/sessions?api-version=2025-04-01-preview
Utwórz tymczasowy token API do użycia na stronie klienta korzystając z API w czasie rzeczywistym. Można skonfigurować z takimi samymi parametrami sesji, co zdarzenie klienta session.update.
Odpowiada obiektem sesji oraz kluczem client_secret, który zawiera tymczasowy token API, umożliwiający uwierzytelnianie klientów przeglądarki w interfejsie API czasu rzeczywistego.
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| input_audio_format | wyliczenie | Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.W przypadku pcm16 dźwięk wejściowy musi być w formacie 16-bitowego PCM z częstotliwością próbkowania 24 kHz, z pojedynczym kanałem (mono) i w kolejności bajtów małobitowej.Możliwe wartości: pcm16, , g711_ulawg711_alaw |
No | |
| input_audio_noise_reduction | obiekt | Konfiguracja redukcji szumu dźwięku wejściowego. Można to ustawić tak, null aby wyłączyć.Filtry redukcji szumów przetwarzają dźwięk dodany do wejściowego bufora audio, zanim zostanie on wysłany do usługi VAD i modelu. Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i zmian (zmniejszając liczbę fałszywie dodatnich wyników) oraz poprawić wydajność modelu poprzez polepszenie postrzegania dźwięku wejściowego. |
No | |
| └typ | wyliczenie | Typ redukcji szumu.
near_field jest przeznaczony dla mikrofonów kierunkowych, takich jak te w słuchawkach, podczas gdy far_field jest przeznaczony dla mikrofonów dalekiego pola, takich jak te w laptopie lub w salach konferencyjnych.Możliwe wartości: near_field, far_field |
No | |
| input_audio_transcription | obiekt | Konfiguracja transkrypcji dźwięku wejściowego, domyślnie wyłączona i może być ustawiona na null, aby wyłączyć po włączeniu. Transkrypcja audio wejściowego nie jest natywna dla modelu, ponieważ model korzysta bezpośrednio z dźwięku. Transkrypcja jest uruchamiana asynchronicznie za pośrednictwem punktu końcowego transkrypcji i powinna być traktowana jako wskazówki dotyczące wejściowej zawartości audio, a nie dokładnie tego, co usłyszał model. Klient ma możliwość ustawienia języka oraz wybrania opcji monitowania o transkrypcję, co zapewnia dodatkowe wskazówki dla usługi transkrypcyjnej. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie. |
No | |
| Model └* | ciąg | Model używany do transkrypcji, bieżące opcje to gpt-4o-transcribe, , gpt-4o-transcribe-diarizegpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15i whisper-1. |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. W przypadku whisper-1 polecenie to lista słów kluczowych.W przypadku gpt-4o-transcribe modeli instrukcja jest wolnym ciągiem tekstowym, na przykład "oczekuj słów związanych z technologią". |
No | |
| instructions | ciąg | Domyślne instrukcje systemowe (tj. komunikat systemowy) są poprzedzane wywołaniami modelu. To pole umożliwia klientowi kierowanie odpowiedziami modelu w pożądany sposób. Model może być poinstruowany na temat zawartości i formatu odpowiedzi (np. "być bardzo zwięzły", "działać przyjazny", "oto przykłady dobrych odpowiedzi") i zachowania audio (np. "szybko rozmawiać", "wstrzykiwanie emocji do głosu", "śmiać się często"). Instrukcje nie gwarantują, że będą przestrzegane przez model, ale zapewniają przewodnictwo dotyczące pożądanego zachowania modelu. Należy pamiętać, że serwer ustawia domyślne instrukcje, które będą używane, jeśli to pole nie jest ustawione i są widoczne w session.created zdarzeniu na początku sesji. |
No | |
| max_response_output_tokens | liczba całkowita lub ciąg | Maksymalna liczba tokenów wyjściowych dla pojedynczej odpowiedzi asystenta, w tym wywołań narzędzi. Podaj liczbę całkowitą z zakresu od 1 do 4096, aby ograniczyć liczbę tokenów wyjściowych, lub użyj inf dla maksymalnej liczby dostępnych tokenów dla danego modelu. Wartość domyślna to inf. |
No | |
| modalities | Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"]. |
No | ||
| model | ciąg | Nazwa wdrożenia używanego na potrzeby tej sesji. |
No | |
| output_audio_format | wyliczenie | Format dźwięku wyjściowego. Opcje to pcm16, g711_ulawlub g711_alaw.W przypadku pcm16parametru dźwięk wyjściowy jest próbkowany z szybkością 24kHz.Możliwe wartości: pcm16, , g711_ulawg711_alaw |
No | |
| temperature | number | Temperatura próbkowania dla modelu ograniczona do [0.6, 1.2]. W przypadku modeli audio temperatura 0,8 jest zdecydowanie zalecana w celu uzyskania najlepszej wydajności. |
No | 0.8 |
| tool_choice | ciąg | W jaki sposób model wybiera narzędzia. Opcje to auto, none, requiredlub określają funkcję. |
No | auto |
| tools | macierz | Narzędzia (funkcje) dostępne dla modelu. | No | |
| turn_detection | obiekt | Konfiguracja wykrywania zmian, albo Server VAD lub Semantic VAD. Można ustawić to na null aby wyłączyć, co spowoduje, że klient będzie musiał ręcznie wyzwolić odpowiedź modelu.Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika. Semantyczna funkcja VAD jest bardziej zaawansowana i używa modelu wykrywania zmiany mówcy (w połączeniu z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie określa limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika zacznie zanikać uhhm, model oceni niskie prawdopodobieństwo zakończenia wypowiedzi i poczeka dłużej na to, aby użytkownik kontynuował mowę. Może to być przydatne w przypadku bardziej naturalnych rozmów, ale może mieć większe opóźnienie. |
No | |
| └create_response | boolean | Określenie, czy odpowiedź powinna być automatycznie generowana po wystąpieniu zdarzenia zatrzymania VAD. |
No | True |
| └* gotowość | wyliczenie | Używane tylko w semantic_vad trybie. Gotowość modelu do reagowania.
low będzie czekać dłużej, aż użytkownik będzie nadal mówić, high będzie reagować szybciej.
auto jest wartością domyślną i jest odpowiednikiem medium.Możliwe wartości: low, , medium, highauto |
No | |
| └reakcja_na_przerwanie | boolean | Określa, czy automatycznie przerywać bieżącą odpowiedź na rzecz wyjścia do domyślnej konwersacji (tj. conversation) po wystąpieniu zdarzenia rozpoczęcia VAD (tj. auto). |
No | True |
| └─prefix_padding_ms | liczba całkowita | Używane tylko w server_vad trybie. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Używane tylko w server_vad trybie. Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika. |
No | |
| └* próg | number | Używane tylko w server_vad trybie. Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach. |
No | |
| └typ | wyliczenie | Typ wykrywania zakrętów. Możliwe wartości: server_vad, semantic_vad |
No | |
| voice | VoiceIdsShared | No |
Responses
Kod stanu: 200
Opis: Sesja została pomyślnie utworzona.
| Content-Type | Type | Description |
|---|---|---|
| application/json | RealtimeSessionCreateResponse |
Utwórz — Transkrypcja sesji w czasie rzeczywistym
POST https://{endpoint}/openai/realtimeapi/transcription_sessions?api-version=2025-04-01-preview
Utwórz tymczasowy token API do używania w aplikacjach klienckich z API czasu rzeczywistego dedykowanym transkrypcjom w czasie rzeczywistym.
Można skonfigurować z takimi samymi parametrami sesji, co zdarzenie klienta transcription_session.update.
Odpowiada obiektem sesji oraz kluczem client_secret, który zawiera tymczasowy token API, umożliwiający uwierzytelnianie klientów przeglądarki w interfejsie API czasu rzeczywistego.
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| include | macierz | Zestaw elementów do uwzględnienia w transkrypcji. Bieżące dostępne elementy to: - item.input_audio_transcription.logprobs |
No | |
| input_audio_format | wyliczenie | Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.W przypadku pcm16 dźwięk wejściowy musi być w formacie 16-bitowego PCM z częstotliwością próbkowania 24 kHz, z pojedynczym kanałem (mono) i w kolejności bajtów małobitowej.Możliwe wartości: pcm16, , g711_ulawg711_alaw |
No | |
| input_audio_noise_reduction | obiekt | Konfiguracja redukcji szumu dźwięku wejściowego. Można to ustawić tak, null aby wyłączyć.Filtry redukcji szumów przetwarzają dźwięk dodany do wejściowego bufora audio, zanim zostanie on wysłany do usługi VAD i modelu. Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i zmian (zmniejszając liczbę fałszywie dodatnich wyników) oraz poprawić wydajność modelu poprzez polepszenie postrzegania dźwięku wejściowego. |
No | |
| └typ | wyliczenie | Typ redukcji szumu.
near_field jest przeznaczony dla mikrofonów kierunkowych, takich jak te w słuchawkach, podczas gdy far_field jest przeznaczony dla mikrofonów dalekiego pola, takich jak te w laptopie lub w salach konferencyjnych.Możliwe wartości: near_field, far_field |
No | |
| input_audio_transcription | obiekt | Konfiguracja transkrypcji dźwięku wejściowego. Klient ma możliwość ustawienia języka oraz wybrania opcji monitowania o transkrypcję, co zapewnia dodatkowe wskazówki dla usługi transkrypcyjnej. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie. |
No | |
| Model └* | wyliczenie | Model używany do transkrypcji, bieżące opcje to gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15i whisper-1.Możliwe wartości: gpt-4o-transcribe, , gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15whisper-1 |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. W przypadku whisper-1 polecenie to lista słów kluczowych.W przypadku gpt-4o-transcribe modeli instrukcja jest wolnym ciągiem tekstowym, na przykład "oczekuj słów związanych z technologią". |
No | |
| modalities | Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"]. |
No | ||
| turn_detection | obiekt | Konfiguracja wykrywania zmian, albo Server VAD lub Semantic VAD. Można ustawić to na null aby wyłączyć, co spowoduje, że klient będzie musiał ręcznie wyzwolić odpowiedź modelu.Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika. Semantyczna funkcja VAD jest bardziej zaawansowana i używa modelu wykrywania zmiany mówcy (w połączeniu z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie określa limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika zacznie zanikać uhhm, model oceni niskie prawdopodobieństwo zakończenia wypowiedzi i poczeka dłużej na to, aby użytkownik kontynuował mowę. Może to być przydatne w przypadku bardziej naturalnych rozmów, ale może mieć większe opóźnienie. |
No | |
| └create_response | boolean | Określenie, czy odpowiedź powinna być automatycznie generowana po wystąpieniu zdarzenia zatrzymania VAD. Niedostępne dla sesji transkrypcji. |
No | True |
| └* gotowość | wyliczenie | Używane tylko w semantic_vad trybie. Gotowość modelu do reagowania.
low będzie czekać dłużej, aż użytkownik będzie nadal mówić, high będzie reagować szybciej.
auto jest wartością domyślną i jest odpowiednikiem medium.Możliwe wartości: low, , medium, highauto |
No | |
| └reakcja_na_przerwanie | boolean | Określa, czy automatycznie przerywać bieżącą odpowiedź na rzecz wyjścia do domyślnej konwersacji (tj. conversation) po wystąpieniu zdarzenia rozpoczęcia VAD (tj. auto). Niedostępne dla sesji transkrypcji. |
No | True |
| └─prefix_padding_ms | liczba całkowita | Używane tylko w server_vad trybie. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Używane tylko w server_vad trybie. Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika. |
No | |
| └* próg | number | Używane tylko w server_vad trybie. Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach. |
No | |
| └typ | wyliczenie | Typ wykrywania zakrętów. Możliwe wartości: server_vad, semantic_vad |
No |
Responses
Kod stanu: 200
Opis: Sesja została pomyślnie utworzona.
| Content-Type | Type | Description |
|---|---|---|
| application/json | RealtimeTranscriptionSessionCreateResponse |
Responses
POST https://{endpoint}/openai/responses?api-version=2025-04-01-preview
Tworzy odpowiedź modelu.
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| include | macierz | No | ||
| dane wejściowe | ciąg lub tablica | Dane wejściowe modelu | Yes | |
| instructions | ciąg | Wstawia komunikat systemu (lub dewelopera) jako pierwszy element w kontekście modelu. Podczas używania previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia proste wymienianie komunikatów systemowych lub komunikatów od deweloperów w nowych odpowiedziach. |
No | |
| max_output_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widoczne tokeny wyjściowe i stan konwersacji. |
No | |
| parallel_tool_calls | boolean | Czy zezwolić modelowi na równoległe uruchamianie wywołań narzędzi. |
No | True |
| previous_response_id | ciąg | Unikatowy identyfikator poprzedniej odpowiedzi na model. Użyj tego, aby utworzyć wielokrotne konwersacje. Dowiedz się więcej o stanie konwersacji. |
No | |
| reasoning | Reasoning | Opcje konfiguracji dla modeli rozumowania. | No | |
| przechowywać | boolean | Określa, czy przechowywać wygenerowaną odpowiedź modelu na potrzeby późniejszego pobierania za pośrednictwem interfejsu API. |
No | True |
| odtwarzać strumieniowo | boolean | W przypadku ustawienia wartości true dane odpowiedzi modelu będą przesyłane strumieniowo do klienta, ponieważ są generowane przy użyciu zdarzeń wysyłanych przez serwer. Aby uzyskać więcej informacji, zobacz sekcję Przesyłanie strumieniowe poniżej. |
No | False |
| SMS | obiekt | Opcje konfiguracji generowania odpowiedzi tekstowej przez model. Może to być zwykły tekst lub dane JSON ze strukturą. Więcej informacji: - Wprowadzanie tekstu i dane wyjściowe - Ustrukturyzowane wyniki |
No | |
| Format └─ | TextResponseFormatConfiguration | Obiekt określający format, który musi zostać wygenerowany przez model. Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, co zapewnia, że model jest zgodny ze podanym schematem JSON.Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.Niezalecane w przypadku modeli gpt-4o i nowszych: Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują. |
No | |
| tool_choice | ToolChoiceOptions lub ToolChoiceTypes lub ToolChoiceFunction | W jaki sposób model powinien wybrać narzędzie (lub narzędzia), które ma być używane podczas generowania odpowiedzi. Zobacz parametr , tools aby zobaczyć, jak określić narzędzia, które może wywołać model. |
No | |
| tools | macierz | Tablica narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając tool_choice parametr .Dwie kategorie narzędzi, które można modelowi podać, to: - Wbudowane narzędzia: narzędzia dostarczane przez firmę OpenAI, które rozszerzają możliwości modelu |
No | |
| truncation | wyliczenie | Strategia obcinania, która ma być użyta dla odpowiedzi modelu. - auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstu modelu, model obcina odpowiedź, aby dopasować okno kontekstu, upuszczając elementy wejściowe w środku konwersacji. - disabled (ustawienie domyślne): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstu dla modelu, żądanie zakończy się niepowodzeniem z powodu błędu 400.Możliwe wartości: auto, disabled |
No |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | response | |
| text/event-stream | responseStreamEvent |
Kod stanu: wartość domyślna
Opis: Usługa niedostępna
| Content-Type | Type | Description |
|---|---|---|
| application/json | errorResponse |
Interfejs API odpowiedzi — elementy wejściowe
GET https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview
Pobiera odpowiedź modelu z danym identyfikatorem.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| response_id | ścieżka | Yes | ciąg | Identyfikator odpowiedzi do pobrania. |
| include | kwerenda | No | macierz | Dodatkowe pola do uwzględnienia w odpowiedzi.
include Aby uzyskać więcej informacji, zobacz parametr tworzenia odpowiedzi powyżej. |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | response |
Kod stanu: wartość domyślna
Opis: Usługa niedostępna
| Content-Type | Type | Description |
|---|---|---|
| application/json | errorResponse |
Usuń odpowiedź
DELETE https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview
Usuwa odpowiedź modelu z danym identyfikatorem.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| response_id | ścieżka | Yes | ciąg | Identyfikator odpowiedzi do usunięcia. |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
Kod stanu: 404
Opis: Nie znaleziono
| Content-Type | Type | Description |
|---|---|---|
| application/json | error |
Kod stanu: wartość domyślna
Opis: Usługa niedostępna
| Content-Type | Type | Description |
|---|---|---|
| application/json | errorResponse |
Interfejs API odpowiedzi — lista elementów odpowiedzi
GET https://{endpoint}/openai/responses/{response_id}/input_items?api-version=2025-04-01-preview
Zwraca listę elementów wejściowych dla danej odpowiedzi.
Parametry identyfikatora URI
| Name | In | Required | Typ | Description |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Yes | ciąg znaków URL | Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| response_id | ścieżka | Yes | ciąg | Identyfikator odpowiedzi, dla której należy pobrać elementy wejściowe. |
| limit | kwerenda | No | liczba całkowita | Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Kolejność przywracania elementów wejściowych. Wartość domyślna to asc.- asc: Zwraca elementy wejściowe w kolejności rosnącej.- desc: Zwraca elementy wejściowe w kolejności malejącej. |
| after | kwerenda | No | ciąg | Identyfikator elementu, po którym wyświetlane są kolejne elementy na liście, używany w stronicowaniu. |
| before | kwerenda | No | ciąg | Identyfikator elementu do wyświetlania listy elementów wcześniej używany w stronicowaniu. |
Nagłówek żądania
Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.
| Name | Required | Typ | Description |
|---|---|---|---|
| Authorization | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizezakres: https://cognitiveservices.azure.com/.default |
| api-key | True | ciąg | Tutaj podaj klucz interfejsu API usługi Azure OpenAI |
Responses
Kod stanu: 200
Opis: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | responseItemList |
Components
errorResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| błąd | error | No |
errorBase
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| kod | ciąg | No | ||
| komunikat | ciąg | No |
błąd
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| inner_error | innerError | Wewnętrzny błąd z dodatkowymi szczegółami. | No | |
| param | ciąg | No | ||
| typ | ciąg | No |
innerError
Wewnętrzny błąd z dodatkowymi szczegółami.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| kod | innerErrorCode | Kody błędów dla obiektu błędu wewnętrznego. | No | |
| content_filter_results | contentFilterPromptResults | Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator. | No |
innerErrorCode
Kody błędów dla obiektu błędu wewnętrznego.
| Property | Value |
|---|---|
| Description | Kody błędów dla obiektu błędu wewnętrznego. |
| Type | ciąg |
| Values | ResponsibleAIPolicyViolation |
dalleErrorResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| błąd | dalleError | No |
dalleError
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| inner_error | dalleInnerError | Wewnętrzny błąd z dodatkowymi szczegółami. | No | |
| param | ciąg | No | ||
| typ | ciąg | No |
dalleInnerError
Wewnętrzny błąd z dodatkowymi szczegółami.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| kod | innerErrorCode | Kody błędów dla obiektu błędu wewnętrznego. | No | |
| content_filter_results | dalleFilterResults | Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator. | No | |
| revised_prompt | ciąg | Polecenie, które zostało użyte do wygenerowania obrazu, jeśli dokonano jakiejkolwiek poprawki do podpowiedzi. | No |
contentFilterCompletionTextSpan
Opisuje zakres w wygenerowanym tekście uzupełniania. Przesunięcie 0 jest pierwszym punktem kodu UTF32 tekstu ukończenia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| completion_end_offset | liczba całkowita | Przesunięcie pierwszego punktu kodu UTF32, który jest wykluczony z zakresu. To pole jest zawsze równe completion_start_offset dla pustych zakresów. To pole jest zawsze większe niż completion_start_offset w przypadku niepustych zakresów. | Yes | |
| completion_start_offset | liczba całkowita | Przesunięcie punktu kodu UTF32, który rozpoczyna zakres. | Yes |
contentFilterResultBase
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| filtered | boolean | Yes |
contentFilterSeverityResult
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| filtered | boolean | Yes | ||
| severity | ciąg | No |
contentFilterDetectedResult
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| detected | boolean | No | ||
| filtered | boolean | Yes |
contentFilterDetectedWithCitationResult
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| citation | obiekt | No | ||
| └* adres URL | ciąg | No | ||
| └─ Licencja | ciąg | No |
contentFilterDetectedWithCompletionTextSpansResult
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| details | macierz | No |
contentFilterIdResult
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| filtered | boolean | Yes | ||
| id | ciąg | No |
contentFilterResultsBase
Informacje o wynikach filtrowania zawartości.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| custom_blocklists | contentFilterDetailedResults | Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów. | No | |
| błąd | errorBase | No | ||
| hate | contentFilterSeverityResult | No | ||
| profanity | contentFilterDetectedResult | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| sexual | contentFilterSeverityResult | No | ||
| violence | contentFilterSeverityResult | No |
contentFilterPromptResults
Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| custom_blocklists | contentFilterDetailedResults | Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów. | No | |
| błąd | errorBase | No | ||
| hate | contentFilterSeverityResult | No | ||
| indirect_attack | contentFilterDetectedResult | No | ||
| jailbreak | contentFilterDetectedResult | No | ||
| profanity | contentFilterDetectedResult | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| sexual | contentFilterSeverityResult | No | ||
| violence | contentFilterSeverityResult | No |
contentFilterChoiceResults
Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o tekście pochodzącym od podmiotów trzecich oraz o wulgaryzmach, czy zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| custom_blocklists | contentFilterDetailedResults | Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów. | No | |
| błąd | errorBase | No | ||
| hate | contentFilterSeverityResult | No | ||
| profanity | contentFilterDetectedResult | No | ||
| protected_material_code | contentFilterDetectedWithCitationResult | No | ||
| protected_material_text | contentFilterDetectedResult | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| sexual | contentFilterSeverityResult | No | ||
| ungrounded_material | contentFilterDetectedWithCompletionTextSpansResult | No | ||
| violence | contentFilterSeverityResult | No |
contentFilterDetailedResults
Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| details | macierz | No | ||
| filtered | boolean | Yes |
promptFilterResult
Wyniki filtrowania treści dla pojedynczego polecenia w żądaniu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_filter_results | contentFilterPromptResults | Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator. | No | |
| prompt_index | liczba całkowita | No |
promptFilterResults
Wyniki filtrowania zawartości dla zera lub większej liczby monitów w żądaniu. W żądaniu przesyłania strumieniowego wyniki dla różnych poleceń mogą pojawiać się o różnych porach lub w różnej kolejności.
Brak zdefiniowanych właściwości dla tego składnika.
dalleContentFilterResults
Informacje o wynikach filtrowania zawartości.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| hate | contentFilterSeverityResult | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| sexual | contentFilterSeverityResult | No | ||
| violence | contentFilterSeverityResult | No |
dalleFilterResults
Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| custom_blocklists | contentFilterDetailedResults | Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów. | No | |
| hate | contentFilterSeverityResult | No | ||
| jailbreak | contentFilterDetectedResult | No | ||
| profanity | contentFilterDetectedResult | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| sexual | contentFilterSeverityResult | No | ||
| violence | contentFilterSeverityResult | No |
chatCompletionsRequestCommon
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| frequency_penalty | number | Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza. | No | 0 |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu. Akceptuje obiekt JSON mapujący tokeny (określone przez ich identyfikator tokenu w tokenizatorze) na skojarzzoną wartość stronniczą z -100 do 100. Matematycznie, przesunięcie jest dodawane do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu. | No | |
| max_completion_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować na potrzeby ukończenia, w tym widoczne tokeny wyjściowe i tokeny rozumowania. | No | |
| max_tokens | liczba całkowita | Maksymalna liczba tokenów dozwolonych dla wygenerowanej odpowiedzi. Domyślnie liczba tokenów, które model może zwrócić, wynosi (4096 - tokeny podpowiedzi). Nie jest to zgodne z modelami serii o1. | No | 4096 |
| metadane | obiekt | Tagi i wartości zdefiniowane przez dewelopera używane do filtrowania uzupełniania na pulpicie nawigacyjnym przechowywanych uzupełniania. | No | |
| presence_penalty | number | Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy. | No | 0 |
| stop | ciąg lub tablica | Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny. | No | |
| przechowywać | boolean | Niezależnie od tego, czy dane wyjściowe tego żądania ukończenia czatu mają być używane w naszych produktach destylacyjnych lub ewaluacyjnych modelu. | No | |
| odtwarzać strumieniowo | boolean | Jeśli zostanie ustawione, wysyłane są częściowe różnice komunikatów, na przykład w ChatGPT. Tokeny są wysyłane jako zdarzenia wysyłane z serwera zawierające tylko dane, gdy stają się dostępne, a strumień jest przerywany komunikatem data: [DONE]. |
No | False |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie. |
No | 1 |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie. |
No | 1 |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc usłudze Azure OpenAI w monitorowaniu i wykrywaniu nadużyć. | No |
createCompletionRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| best_of | liczba całkowita | Generuje uzupełnienia best_of po stronie serwera i zwraca najlepszą (tę z najwyższym logarytmicznym prawdopodobieństwem na token). Nie można przesyłać strumieniowo wyników.W przypadku użycia z n, best_of kontroluje liczbę potencjalnych kandydatów do zakończenia, a n określa, ile z nich należy zwrócić.
best_of wartość musi być większa niż n.Uwaga: ponieważ ten parametr generuje wiele uzupełnień, może szybko wyczerpać przydział tokenów. Należy ostrożnie używać i upewnić się, że masz odpowiednie ustawienia dla max_tokens i stop. |
No | 1 |
| echo | boolean | Powtórz ponownie monit oprócz ukończenia |
No | False |
| frequency_penalty | number | Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza. |
No | 0 |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu. Akceptuje obiekt JSON, który mapuje tokeny (określone przez ich identyfikator tokenu w tokenizatorze GPT) do odpowiadającej wartości uprzedzenia od -100 do 100. Matematycznie, przesunięcie jest dodawane do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu. Na przykład możesz przekazać polecenie {"50256": -100} , aby zapobiec wygenerowaniu tokenu <|endoftext|> . |
No | None |
| logprobs | liczba całkowita | Uwzględnij logarytmiczne prawdopodobieństwa dla logprobs najbardziej prawdopodobnych tokenów wyjściowych oraz wybranych tokenów. Na przykład jeśli logprobs ma wartość 5, interfejs API zwróci listę 5 najbardziej prawdopodobnych tokenów. Interfejs API zawsze zwraca logprob próbkowanego tokenu, więc w odpowiedzi może być maksymalnie logprobs+1 elementów.Maksymalna wartość parametru logprobs to 5. |
No | None |
| max_tokens | liczba całkowita | Maksymalna liczba tokenów, które można wygenerować w zakończeniu. Liczba tokenów zapytania plus max_tokens nie może przekraczać długości kontekstu modelu. |
No | 16 |
| n | liczba całkowita | Ile uzupełnień ma zostać wygenerowanych dla każdego polecenia. Uwaga: ponieważ ten parametr generuje wiele uzupełnień, może szybko wyczerpać przydział tokenów. Należy ostrożnie używać i upewnić się, że masz odpowiednie ustawienia dla max_tokens i stop. |
No | 1 |
| presence_penalty | number | Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy. |
No | 0 |
| monit | ciąg lub tablica | Monity do generowania uzupełnień, zakodowane jako ciąg znaków, tablica ciągów znaków, tablica tokenów lub tablica tablic tokenów. Należy pamiętać, że <|endoftext|> jest separatorem dokumentu, który widzi model podczas trenowania, więc jeśli monit nie zostanie określony, model zostanie wygenerowany tak, jakby od początku nowego dokumentu. |
Yes | |
| seed | liczba całkowita | Jeśli zostaną określone, nasz system dokłada wszelkich starań, aby próbkowanie deterministyczne sprawiało, że powtarzające się żądania z tymi samymi parametrami seed zwracają ten sam wynik.Determinizm nie jest gwarantowany i należy odwołać się do parametru odpowiedzi system_fingerprint w celu monitorowania zmian na serwerze. |
No | |
| stop | ciąg lub tablica | Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny. Zwrócony tekst nie będzie zawierać sekwencji zatrzymania. |
No | |
| odtwarzać strumieniowo | boolean | Czy należy przesyłać strumieniowo częściowy postęp. W przypadku ustawienia tokeny są wysyłane jako zdarzenia wysyłane tylko do serwera, gdy staną się dostępne, a strumień zostanie zakończony komunikatem data: [DONE] .
Przykładowy kod języka Python. |
No | False |
| suffix | ciąg | Sufiks, który pojawia się po zakończeniu wstawionego tekstu. Ten parametr jest obsługiwany tylko dla programu gpt-3.5-turbo-instruct. |
No | None |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie. |
No | 1 |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie. |
No | 1 |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. |
No |
createCompletionResponse
Reprezentuje odpowiedź końcową z interfejsu API. Uwaga: zarówno przesyłane strumieniowo, jak i nie przesyłane strumieniowo obiekty odpowiedzi mają ten sam kształt (w przeciwieństwie do punktu końcowego czatu).
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| choices | macierz | Lista opcji uzupełniania, które model wygenerował dla promptu wejściowego. | Yes | |
| created | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) czasu utworzenia ukończenia. | Yes | |
| id | ciąg | Unikalny identyfikator ukończenia. | Yes | |
| model | ciąg | Model używany do ukończenia. | Yes | |
| obiekt | wyliczenie | Typ obiektu, który jest zawsze „ukończenie_tekstu” Możliwe wartości: text_completion |
Yes | |
| prompt_filter_results | promptFilterResults | Wyniki filtrowania zawartości dla zera lub większej liczby monitów w żądaniu. W żądaniu przesyłania strumieniowego wyniki dla różnych poleceń mogą pojawiać się o różnych porach lub w różnej kolejności. | No | |
| system_fingerprint | ciąg | Ten odcisk palca reprezentuje zaplecze systemowe, z którym działa model. Można użyć w połączeniu z parametrem żądania seed, aby zrozumieć, kiedy wprowadzono zmiany w back-endzie, które mogą wpływać na deterministyczne działanie. |
No | |
| użycie | completionUsage | Statystyki użycia dotyczące żądania zakończenia. | No |
createChatCompletionRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| audio | obiekt | Parametry dla danych wyjściowych dźwięku. Wymagane przy żądaniu wyjścia audio za użyciem modalities: ["audio"]. |
No | |
| Format └─ | wyliczenie | Określa format dźwięku wyjściowego. Musi być jednym z wav, mp3, flac, opus lub pcm16. Możliwe wartości: wav, , mp3flac, , opuspcm16 |
No | |
| └─ głos | wyliczenie | Określa typ głosu. Obsługiwane głosy to alloy, echo, fable, onyx, nova i shimmer.Możliwe wartości: alloy, , echofable, onyx, , novashimmer |
No | |
| data_sources | macierz | Wpisy konfiguracji dla rozszerzeń czatu usługi Azure OpenAI, które ich używają. Ta dodatkowa specyfikacja jest zgodna tylko z usługą Azure OpenAI. |
No | |
| frequency_penalty | number | Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza. |
No | 0 |
| function_call | ciąg lub czatCompletionFunctionCallOption | Przestarzałe na rzecz tool_choice.Określa, która (jeśli istnieje) funkcja jest wywoływana przez model. none oznacza, że model nie wywoła funkcji, a zamiast tego generuje komunikat.auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem funkcji.Określenie określonej funkcji za pośrednictwem {"name": "my_function"} wymusza wywołanie tej funkcji przez model.none jest wartością domyślną, gdy nie ma żadnych funkcji.
auto jest wartością domyślną, jeśli funkcje są obecne. |
No | |
| functions | macierz | Przestarzałe na rzecz tools.Lista funkcji, dla których model może generować dane wejściowe JSON. |
No | |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu. Akceptuje obiekt JSON mapujący tokeny (określone przez ich identyfikator tokenu w tokenizatorze) na skojarzoną wartość stronniczą z zakresu od -100 do 100. Matematycznie, przesunięcie jest dodawane do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu. |
No | None |
| logprobs | boolean | Czy zwracać logarytmiczne prawdopodobieństwa dla tokenów wyjściowych, czy nie. Jeśli true, zwraca logarytmiczne prawdopodobieństwa każdego tokenu wyjściowego zwróconego w content elementu message. |
No | False |
| max_completion_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować na potrzeby ukończenia, w tym widoczne tokeny wyjściowe i tokeny rozumowania. | No | |
| max_tokens | liczba całkowita | Maksymalna liczba tokenów, które można wygenerować podczas kończenia czatu. Łączna długość tokenów wejściowych i wygenerowanych tokenów jest ograniczona przez długość kontekstu modelu. |
No | |
| messages | macierz | Lista wiadomości składających się z konwersacji do tej pory. Przykładowy kod języka Python. | Yes | |
| metadane | obiekt | Tagi i wartości zdefiniowane przez dewelopera używane do filtrowania uzupełniania na pulpicie nawigacyjnym przechowywanych uzupełniania. | No | |
| modalities | ChatCompletionModalities | Typy danych wyjściowych, które mają być generowane przez model dla tego żądania. Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną: ["text"]Model gpt-4o-audio-preview może również służyć do generowania dźwięku. Aby zażądać, aby ten model wygenerował odpowiedzi tekstowe i audio, możesz użyć:["text", "audio"] |
No | |
| n | liczba całkowita | Ile opcji ukończenia czatu ma być generowanych dla każdej wiadomości wejściowej. Pamiętaj, że opłaty będą naliczane na podstawie liczby wygenerowanych tokenów we wszystkich opcjach. Zachowaj n jako 1 aby zminimalizować koszty. |
No | 1 |
| parallel_tool_calls | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. | No | True |
| przewidywanie | PredictionContent | Konfiguracja przewidywanych danych wyjściowych, która może znacznie poprawić czas odpowiedzi, gdy duże części odpowiedzi modelu są znane z wyprzedzeniem. Jest to najbardziej typowe w przypadku ponownego generowania pliku z tylko drobnymi zmianami w większości zawartości. | No | |
| presence_penalty | number | Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy. |
No | 0 |
| reasoning_effort | wyliczenie |
Tylko modele o1 Ogranicza nakład pracy na rozumowanie modeli rozumowania. Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi.Możliwe wartości: low, , mediumhigh |
No | |
| response_format | ResponseFormatText lub ResponseFormatJsonObject lub ResponseFormatJsonSchema | Obiekt określający format, który musi zostać wygenerowany przez model. Zgodny z GPT-4o, GPT-4o mini, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo nowszymi niż gpt-3.5-turbo-1106.Ustawienie parametru na { "type": "json_schema", "json_schema": {...} } włącza Dane Wyjściowe ze Strukturą, które zapewniają zgodność modelu z podanym schematem JSON.Ustawienie { "type": "json_object" } włącza tryb JSON, co gwarantuje, że komunikat generowany przez model jest poprawnym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| seed | liczba całkowita | Ta funkcja jest dostępna w wersji beta. Jeśli zostaną określone, nasz system dokłada wszelkich starań, aby próbkowanie deterministyczne sprawiało, że powtarzające się żądania z tymi samymi parametrami seed zwracają ten sam wynik.Determinizm nie jest gwarantowany i należy odwołać się do parametru odpowiedzi system_fingerprint w celu monitorowania zmian na serwerze. |
No | |
| stop | ciąg lub tablica | Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny. |
No | |
| przechowywać | boolean | Niezależnie od tego, czy dane wyjściowe tego żądania ukończenia czatu mają być używane w naszych produktach destylacyjnych lub ewaluacyjnych modelu. | No | |
| odtwarzać strumieniowo | boolean | Jeśli zostanie ustawione, wysyłane są częściowe różnice komunikatów, na przykład w ChatGPT. Tokeny są wysyłane jako zdarzenia wysyłane tylko do serwera w miarę data: [DONE] ich dostępności, a strumień jest przerywany przez komunikat.
Przykładowy kod języka Python. |
No | False |
| stream_options | chatCompletionStreamOptions | Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true. |
No | None |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie. |
No | 1 |
| tool_choice | chatCompletionToolChoiceOption | Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie wywoła żadnego narzędzia i zamiast tego generuje komunikat.
auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia.
required oznacza, że model musi wywoływać co najmniej jedno narzędzie. Określenie określonego narzędzia za pośrednictwem {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
none jest ustawieniem domyślnym, gdy żadne narzędzia nie są obecne.
auto jest wartością domyślną, jeśli istnieją narzędzia. |
No | |
| tools | macierz | Lista narzędzi, które model może wywołać. Obecnie tylko funkcje są obsługiwane jako narzędzie. Służy do udostępniania listy funkcji, dla których model może generować dane wejściowe JSON. Obsługiwane są maksymalnie 128 funkcji. |
No | |
| top_logprobs | liczba całkowita | Liczba całkowita z zakresu od 0 do 20 określająca liczbę najbardziej prawdopodobnych tokenów do zwrócenia na każdej pozycji, z których każdy ma skojarzone logarytmiczne prawdopodobieństwo.
logprobs musi być ustawione na true, jeśli ten parametr jest używany. |
No | |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie. |
No | 1 |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. |
No | |
| user_security_context | userSecurityContext | Kontekst zabezpieczeń użytkownika zawiera kilka parametrów opisujących samą aplikację sztucznej inteligencji oraz użytkownika końcowego, który wchodzi w interakcję z aplikacją sztucznej inteligencji. Te pola ułatwiają zespołom ds. operacji zabezpieczeń badanie i eliminowanie zdarzeń zabezpieczeń, zapewniając kompleksowe podejście do ochrony aplikacji sztucznej inteligencji. Dowiedz się więcej o ochronie aplikacji sztucznej inteligencji przy użyciu Microsoft Defender dla Chmury. | No |
userSecurityContext
Kontekst zabezpieczeń użytkownika zawiera kilka parametrów opisujących samą aplikację sztucznej inteligencji oraz użytkownika końcowego, który wchodzi w interakcję z aplikacją sztucznej inteligencji. Te pola ułatwiają zespołom ds. operacji zabezpieczeń badanie i eliminowanie zdarzeń zabezpieczeń, zapewniając kompleksowe podejście do ochrony aplikacji sztucznej inteligencji. Dowiedz się więcej o ochronie aplikacji sztucznej inteligencji przy użyciu Microsoft Defender dla Chmury.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| application_name | ciąg | Nazwa aplikacji. Poufne dane osobowe nie powinny być uwzględniane w tym polu. | No | |
| end_user_id | ciąg | Ten identyfikator jest identyfikatorem obiektu użytkownika Entra ID firmy Microsoft (dawniej Azure Active Directory) używanym do uwierzytelniania użytkowników końcowych w aplikacji generującej sztuczną inteligencję. Poufne dane osobowe nie powinny być uwzględniane w tym polu. | No | |
| end_user_tenant_id | ciąg | Identyfikator dzierżawy platformy Microsoft 365, do którego należy użytkownik końcowy. Jest to wymagane, gdy aplikacja generacyjna sztucznej inteligencji jest wielodostępna. | No | |
| source_ip | ciąg | Przechwytuje adres IP oryginalnego klienta, akceptując zarówno formatY IPv4, jak i IPv6. | No |
chatCompletionFunctions
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| description | ciąg | Opis działania funkcji używanej przez model do wyboru, kiedy i jak wywołać funkcję. | No | |
| name | ciąg | Nazwa funkcji do wywołania. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków. | Yes | |
| parameters | FunctionParameters | Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON.
Zapoznaj się z przewodnikiem w celu poznania przykładów oraz z odniesieniem do schematu JSON dla dokumentacji dotyczącej formatu. Pominięcie parameters definiuje funkcję z pustą listą parametrów. |
No |
chatCompletionFunctionCallOption
Określenie określonej funkcji za pośrednictwem {"name": "my_function"} wymusza wywołanie tej funkcji przez model.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| name | ciąg | Nazwa funkcji do wywołania. | Yes |
chatCompletionFunctionParameters
Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON. Zapoznaj się z przewodnikiem/, aby zapoznać się z przykładami, oraz dokumentacją dotyczącą schematu JSON, aby uzyskać dokumentację dotyczącą formatu.
Brak zdefiniowanych właściwości dla tego składnika.
chatCompletionRequestMessage
Ten składnik może być jednym z następujących elementów:
- ChatCompletionRequestDeveloperMessage
- chatCompletionRequestSystemMessage
- chatCompletionRequestUserMessage
- chatCompletionRequestAssistantMessage
- chatCompletionRequestToolMessage
- chatCompletionRequestFunctionMessage
ChatCompletionRequestDeveloperMessage
Instrukcje podane przez dewelopera, które powinny być zgodne z modelem, niezależnie od komunikatów wysyłanych przez użytkownika.
W przypadku modeli o1 i nowszych developer komunikaty zastępują poprzednie system komunikaty.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Zawartość komunikatu dla deweloperów. | Yes | |
| name | ciąg | Opcjonalna nazwa uczestnika. Zawiera informacje o modelu umożliwiające rozróżnienie między uczestnikami tej samej roli. | No | |
| rola | wyliczenie | Rola autora komunikatów, w tym przypadku developer.Możliwe wartości: developer |
Yes |
chatCompletionRequestSystemMessage
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Zawartość komunikatu systemowego. | Yes | |
| name | ciąg | Opcjonalna nazwa uczestnika. Zawiera informacje o modelu umożliwiające rozróżnienie między uczestnikami tej samej roli. | No | |
| rola | wyliczenie | Rola autora komunikatów, w tym przypadku system.Możliwe wartości: system |
Yes |
chatCompletionRequestUserMessage
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Zawartość wiadomości użytkownika. |
Yes | |
| name | ciąg | Opcjonalna nazwa uczestnika. Zawiera informacje o modelu umożliwiające rozróżnienie między uczestnikami tej samej roli. | No | |
| rola | wyliczenie | Rola autora komunikatów, w tym przypadku user.Możliwe wartości: user |
Yes |
chatCompletionRequestAssistantMessage
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Zawartość komunikatu asystenta. Wymagane, chyba że określono tool_calls lub function_call. |
No | |
| function_call | obiekt | Przestarzałe i zastąpione przez tool_calls. Nazwa i argumenty funkcji, które powinny być wywoływane, generowane przez model. |
No | |
| └─ Argumenty | ciąg | Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. | No | |
| └─ nazwa | ciąg | Nazwa funkcji do wywołania. | No | |
| name | ciąg | Opcjonalna nazwa uczestnika. Zawiera informacje o modelu umożliwiające rozróżnienie między uczestnikami tej samej roli. | No | |
| refusal | ciąg | Wiadomość o odmowie asystenta. | No | |
| rola | wyliczenie | Rola autora komunikatów, w tym przypadku assistant.Możliwe wartości: assistant |
Yes | |
| tool_calls | chatCompletionMessageToolCalls | Wywołania narzędzi generowane przez model, takie jak wywołania funkcji. | No |
chatCompletionRequestToolMessage
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Zawartość komunikatu narzędzia. | Yes | |
| rola | wyliczenie | Rola autora komunikatów, w tym przypadku tool.Możliwe wartości: tool |
Yes | |
| tool_call_id | ciąg | Wywołanie narzędzia, na które odpowiada ten komunikat. | Yes |
chatCompletionRequestFunctionMessage
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg | Zawartość komunikatu funkcji. | Yes | |
| name | ciąg | Nazwa funkcji do wywołania. | Yes | |
| rola | wyliczenie | Rola autora komunikatów, w tym przypadku function.Możliwe wartości: function |
Yes |
chatCompletionRequestDeveloperMessageContentPart
Ten składnik może być jednym z następujących elementów:
chatCompletionRequestSystemMessageContentPart
Ten składnik może być jednym z następujących elementów:
chatCompletionRequestUserMessageContentPart
Ten składnik może być jednym z następujących elementów:
- chatCompletionRequestMessageContentPartText
- chatCompletionRequestMessageContentPartImage
- chatCompletionRequestMessageContentPartAudio
chatCompletionRequestAssistantMessageContentPart
Ten składnik może być jednym z następujących elementów:
chatCompletionRequestToolMessageContentPart
Ten składnik może być jednym z następujących elementów:
chatCompletionRequestMessageContentPartText
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| SMS | ciąg | Zawartość tekstowa. | Yes | |
| typ | wyliczenie | Typ części zawartości. Możliwe wartości: text |
Yes |
chatCompletionRequestMessageContentPartAudio
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| input_audio | obiekt | Yes | ||
| └─ dane | ciąg | Dane audio zakodowane w formacie Base64. | No | |
| Format └─ | wyliczenie | Format zakodowanych danych dźwiękowych. Obecnie obsługuje "wav" i "mp3". Możliwe wartości: wav, mp3 |
No | |
| typ | wyliczenie | Typ części zawartości. Zawsze input_audio.Możliwe wartości: input_audio |
Yes |
chatCompletionRequestMessageContentPartImage
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| image_url | obiekt | Yes | ||
| └* szczegóły | wyliczenie | Określa poziom szczegółowości obrazu. Dowiedz się więcej w przewodniku Vision. Możliwe wartości: auto, , lowhigh |
No | |
| └─ adres URL | ciąg | Adres URL obrazu lub zakodowane w formacie base64 dane obrazu. | No | |
| typ | wyliczenie | Typ części zawartości. Możliwe wartości: image_url |
Yes |
chatCompletionRequestMessageContentPartRefusal
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| refusal | ciąg | Komunikat o odmowie wygenerowany przez model. | Yes | |
| typ | wyliczenie | Typ części zawartości. Możliwe wartości: refusal |
Yes |
azureChatExtensionConfiguration
Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.
###Discriminator dla azureChatExtensionConfiguration
Ten składnik używa właściwości type do rozróżniania różnych typów:
| Wartość typu | Schema |
|---|---|
azure_search |
azureSearchChatExtensionConfiguration |
azure_cosmos_db |
azureCosmosDBChatExtensionConfiguration |
elasticsearch |
elasticsearchChatExtensionConfiguration |
mongo_db |
mongoDBChatExtensionConfiguration |
pinecone |
pineconeChatExtensionConfiguration |
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | azureChatExtensionType | Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI. |
Yes |
azureChatExtensionType
Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.
| Property | Value |
|---|---|
| Description | Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI. |
| Type | ciąg |
| Values | azure_searchazure_cosmos_dbelasticsearchmongo_dbpinecone |
azureSearchChatExtensionConfiguration
Konkretna reprezentacja konfigurowalnych opcji usługi Azure Search podczas korzystania z niej jako rozszerzenia czatu usługi Azure OpenAI.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| parameters | azureSearchChatExtensionParameters | Parametry usługi Azure Search, gdy są używane jako rozszerzenie czatu usługi Azure OpenAI. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI. |
Yes |
azureSearchChatExtensionParameters
Parametry usługi Azure Search, gdy są używane jako rozszerzenie czatu usługi Azure OpenAI.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. | No | False |
| uwierzytelnianie | onYourDataApiKeyAuthenticationOptions lub onYourDataSystemAssignedManagedIdentityAuthenticationOptions lub onYourDataUserAssignedManagedIdentityAuthenticationOptions lub onYourDataAccessTokenAuthenticationOptions | Yes | ||
| embedding_dependency | onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource lub onYourDataIntegratedVectorizationSource | No | ||
| punkt końcowy | ciąg | Bezwzględna ścieżka punktu końcowego zasobu usługi Azure Search do użycia. | Yes | |
| fields_mapping | azureSearchIndexFieldMappingOptions | Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu usługi Azure Search. | No | |
| filtr | ciąg | Filtr wyszukiwania. | No | |
| in_scope | boolean | Czy zapytania powinny być ograniczone do używania indeksowanych danych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. |
No | |
| index_name | ciąg | Nazwa indeksu, który ma być używany jako dostępny w przywoływowanym zasobie usługi Azure Search. | Yes | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. | No | |
| query_type | azureSearchQueryType | Typ zapytania wyszukiwania w usłudze Azure Search, który należy wykonać podczas korzystania z niej jako rozszerzenia czatu w usłudze Azure OpenAI. | No | |
| semantic_configuration | ciąg | Dodatkowa konfiguracja semantyczna zapytania. | No | |
| strictness | liczba całkowita | Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. | No |
azureSearchIndexFieldMappingOptions
Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu usługi Azure Search.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_fields | macierz | Nazwy pól indeksu, które powinny być traktowane jako zawartość. | No | |
| content_fields_separator | ciąg | Wzorzec separatora, którego powinny używać pola zawartości. | No | |
| filepath_field | ciąg | Nazwa pola indeksu do użycia jako ścieżka pliku. | No | |
| image_vector_fields | macierz | Nazwy pól reprezentujących dane wektorów obrazów. | No | |
| title_field | ciąg | Nazwa pola indeksu, które ma być używane jako tytuł. | No | |
| url_field | ciąg | Nazwa pola indeksu, które ma być używane jako adres URL. | No | |
| vector_fields | macierz | Nazwy pól reprezentujących dane wektorowe. | No |
azureSearchQueryType
Typ zapytania wyszukiwania w usłudze Azure Search, który należy wykonać podczas korzystania z niej jako rozszerzenia czatu w usłudze Azure OpenAI.
| Property | Value |
|---|---|
| Description | Typ zapytania wyszukiwania w usłudze Azure Search, który należy wykonać podczas korzystania z niej jako rozszerzenia czatu w usłudze Azure OpenAI. |
| Type | ciąg |
| Values | simplesemanticvectorvector_simple_hybridvector_semantic_hybrid |
azureCosmosDBChatExtensionConfiguration
Konkretna reprezentacja konfigurowalnych opcji dla usługi Azure Cosmos DB w przypadku korzystania z niej jako rozszerzenia czatu usługi Azure OpenAI.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| parameters | azureCosmosDBChatExtensionParameters | Parametry do użycia podczas konfigurowania rozszerzenia czatu usługi Azure OpenAI na czacie danych podczas korzystania z usługi Azure Cosmos DB dla rdzeni wirtualnych bazy danych MongoDB. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI. |
Yes |
azureCosmosDBChatExtensionParameters
Parametry do użycia podczas konfigurowania rozszerzenia czatu usługi Azure OpenAI na czacie danych podczas korzystania z usługi Azure Cosmos DB dla rdzeni wirtualnych bazy danych MongoDB.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. | No | False |
| uwierzytelnianie | onYourDataConnectionStringAuthenticationOptions | Opcje uwierzytelniania dla Azure OpenAI na Twoich danych przy użyciu ciągu połączenia. | Yes | |
| container_name | ciąg | Nazwa kontenera zasobów usługi Azure Cosmos DB. | Yes | |
| database_name | ciąg | Nazwa bazy danych MongoDB vCore do użycia z Azure Cosmos DB. | Yes | |
| embedding_dependency | onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource | Yes | ||
| fields_mapping | azureCosmosDBFieldMappingOptions | Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól przy użyciu skonfigurowanego zasobu usługi Azure Cosmos DB. | Yes | |
| in_scope | boolean | Czy zapytania powinny być ograniczone do używania indeksowanych danych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. |
No | |
| index_name | ciąg | Nazwa indeksu vCore MongoDB do użycia z Azure Cosmos DB. | Yes | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. | No | |
| strictness | liczba całkowita | Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. | No |
azureCosmosDBFieldMappingOptions
Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól przy użyciu skonfigurowanego zasobu usługi Azure Cosmos DB.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_fields | macierz | Nazwy pól indeksu, które powinny być traktowane jako zawartość. | Yes | |
| content_fields_separator | ciąg | Wzorzec separatora, którego powinny używać pola zawartości. | No | |
| filepath_field | ciąg | Nazwa pola indeksu do użycia jako ścieżka pliku. | No | |
| title_field | ciąg | Nazwa pola indeksu, które ma być używane jako tytuł. | No | |
| url_field | ciąg | Nazwa pola indeksu, które ma być używane jako adres URL. | No | |
| vector_fields | macierz | Nazwy pól reprezentujących dane wektorowe. | Yes |
elasticsearchChatExtensionConfiguration
Konkretna reprezentacja konfigurowalnych opcji usługi Elasticsearch podczas korzystania z niej jako rozszerzenia czatu usługi Azure OpenAI.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| parameters | elasticsearchChatExtensionParameters | Parametry do użycia podczas konfigurowania elasticsearchâ® jako rozszerzenia czatu usługi Azure OpenAI. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI. |
Yes |
elasticsearchChatExtensionParameters
Parametry do użycia podczas konfigurowania elasticsearchâ® jako rozszerzenia czatu usługi Azure OpenAI.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. | No | False |
| uwierzytelnianie | onYourDataKeyAndKeyIdAuthenticationOptions lub onYourDataEncodedApiKeyAuthenticationOptions | Yes | ||
| embedding_dependency | onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource lub onYourDataModelIdVectorizationSource | No | ||
| punkt końcowy | ciąg | Punkt końcowy usługi Elasticsearch®. | Yes | |
| fields_mapping | elasticsearchIndexFieldMappingOptions | Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól przy użyciu skonfigurowanego zasobu Elasticsearch®. | No | |
| in_scope | boolean | Czy zapytania powinny być ograniczone do używania indeksowanych danych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. |
No | |
| index_name | ciąg | Nazwa indeksu Elasticsearch®. | Yes | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. | No | |
| query_type | elasticsearchQueryType | Typ zapytania pobierania Elasticsearch®, które należy wykonać podczas korzystania z Elasticsearch jako rozszerzenia czatu usługi Azure OpenAI. | No | |
| strictness | liczba całkowita | Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. | No |
elasticsearchIndexFieldMappingOptions
Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól przy użyciu skonfigurowanego zasobu Elasticsearch®.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_fields | macierz | Nazwy pól indeksu, które powinny być traktowane jako zawartość. | No | |
| content_fields_separator | ciąg | Wzorzec separatora, którego powinny używać pola zawartości. | No | |
| filepath_field | ciąg | Nazwa pola indeksu do użycia jako ścieżka pliku. | No | |
| title_field | ciąg | Nazwa pola indeksu, które ma być używane jako tytuł. | No | |
| url_field | ciąg | Nazwa pola indeksu, które ma być używane jako adres URL. | No | |
| vector_fields | macierz | Nazwy pól reprezentujących dane wektorowe. | No |
elasticsearchQueryType
Typ zapytania pobierania Elasticsearch®, które należy wykonać podczas korzystania z Elasticsearch jako rozszerzenia czatu usługi Azure OpenAI.
| Property | Value |
|---|---|
| Description | Typ zapytania pobierania Elasticsearch®, które należy wykonać podczas korzystania z Elasticsearch jako rozszerzenia czatu usługi Azure OpenAI. |
| Type | ciąg |
| Values | simplevector |
mongoDBChatExtensionConfiguration
Konkretna reprezentacja konfigurowalnych opcji bazy danych Mongo DB podczas korzystania z niej jako rozszerzenia czatu usługi Azure OpenAI.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| parameters | mongoDBChatExtensionParameters | Parametry do użycia podczas konfigurowania rozszerzenia czatu usługi Azure OpenAI na czacie danych podczas korzystania z bazy danych Mongo DB. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI. |
Yes |
mongoDBChatExtensionParameters
Parametry do użycia podczas konfigurowania rozszerzenia czatu usługi Azure OpenAI na czacie danych podczas korzystania z bazy danych Mongo DB.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. | No | False |
| app_name | ciąg | Nazwa aplikacji mongo DB. | Yes | |
| uwierzytelnianie | onYourDataUsernameAndPasswordAuthenticationOptions | Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data podczas korzystania z nazwy użytkownika i hasła. | Yes | |
| collection_name | ciąg | Nazwa kolekcji mongo DB. | Yes | |
| database_name | ciąg | Nazwa bazy danych Mongo DB. | Yes | |
| embedding_dependency | onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource | Yes | ||
| punkt końcowy | ciąg | Nazwa punktu końcowego klastra bazy danych Mongo DB. | Yes | |
| fields_mapping | mongoDBFieldMappingOptions | Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu bazy danych Mongo DB. | Yes | |
| in_scope | boolean | Czy zapytania powinny być ograniczone do używania indeksowanych danych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. |
No | |
| index_name | ciąg | Nazwa indeksu bazy danych Mongo DB. | Yes | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. | No | |
| strictness | liczba całkowita | Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. | No |
mongoDBFieldMappingOptions
Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu bazy danych Mongo DB.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_fields | macierz | Nazwy pól indeksu, które powinny być traktowane jako zawartość. | Yes | |
| content_fields_separator | ciąg | Wzorzec separatora, którego powinny używać pola zawartości. | No | |
| filepath_field | ciąg | Nazwa pola indeksu do użycia jako ścieżka pliku. | No | |
| title_field | ciąg | Nazwa pola indeksu, które ma być używane jako tytuł. | No | |
| url_field | ciąg | Nazwa pola indeksu, które ma być używane jako adres URL. | No | |
| vector_fields | macierz | Nazwy pól reprezentujących dane wektorowe. | Yes |
pineconeChatExtensionConfiguration
Konkretna reprezentacja konfigurowalnych opcji pinecone podczas korzystania z niej jako rozszerzenia czatu Usługi Azure OpenAI.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| parameters | pineconeChatExtensionParameters | Parametry konfigurowania rozszerzeń czatu Pinecone w usłudze Azure OpenAI. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI. |
Yes |
pineconeChatExtensionParameters
Parametry konfigurowania rozszerzeń czatu Pinecone w usłudze Azure OpenAI.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. | No | False |
| uwierzytelnianie | onYourDataApiKeyAuthenticationOptions | Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data przy użyciu klucza API. | Yes | |
| embedding_dependency | onYourDataDeploymentNameVectorizationSource | Szczegóły źródła wektoryzacji używanego przez usługę Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego opartego na wewnętrznej nazwie wdrożenia modelu osadzania w tym samym zasobie usługi Azure OpenAI. | Yes | |
| środowisko | ciąg | Nazwa środowiska Pinecone. | Yes | |
| fields_mapping | pineconeFieldMappingOptions | Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu Pinecone. | Yes | |
| in_scope | boolean | Czy zapytania powinny być ograniczone do używania indeksowanych danych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. |
No | |
| index_name | ciąg | Nazwa indeksu bazy danych Pinecone. | Yes | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. | No | |
| strictness | liczba całkowita | Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. | No |
pineconeFieldMappingOptions
Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu Pinecone.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_fields | macierz | Nazwy pól indeksu, które powinny być traktowane jako zawartość. | Yes | |
| content_fields_separator | ciąg | Wzorzec separatora, którego powinny używać pola zawartości. | No | |
| filepath_field | ciąg | Nazwa pola indeksu do użycia jako ścieżka pliku. | No | |
| title_field | ciąg | Nazwa pola indeksu, które ma być używane jako tytuł. | No | |
| url_field | ciąg | Nazwa pola indeksu, które ma być używane jako adres URL. | No |
onYourDataAuthenticationOptions
Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data.
Dyskryminator dla opcji uwierzytelniania onYourData
Ten składnik używa właściwości type do rozróżniania różnych typów:
| Wartość typu | Schema |
|---|---|
api_key |
onYourDataApiKeyAuthenticationOptions |
connection_string |
onYourDataConnectionStringAuthenticationOptions |
key_and_key_id |
onYourDataKeyAndKeyIdAuthenticationOptions |
encoded_api_key |
onYourDataEncodedApiKeyAuthenticationOptions |
access_token |
onYourDataAccessTokenAuthenticationOptions |
system_assigned_managed_identity |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions |
user_assigned_managed_identity |
onYourDataUserAssignedManagedIdentityAuthenticationOptions |
username_and_password |
onYourDataUsernameAndPasswordAuthenticationOptions |
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | onYourDataAuthenticationType | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. | Yes |
onYourDataContextProperty
Właściwość kontekstu.
| Property | Value |
|---|---|
| Description | Właściwość kontekstu. |
| Type | ciąg |
| Values | citationsintentall_retrieved_documents |
onYourDataAuthenticationType
Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych.
| Property | Value |
|---|---|
| Description | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. |
| Type | ciąg |
| Values | api_keyconnection_stringkey_and_key_idencoded_api_keyaccess_tokensystem_assigned_managed_identityuser_assigned_managed_identityusername_and_password |
onYourDataApiKeyAuthenticationOptions
Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data przy użyciu klucza API.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| klucz | ciąg | Klucz interfejsu API do użycia do uwierzytelniania. | No | |
| typ | onYourDataAuthenticationType | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. | Yes |
onYourDataConnectionStringAuthenticationOptions
Opcje uwierzytelniania dla Azure OpenAI na Twoich danych przy użyciu ciągu połączenia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| connection_string | ciąg | Parametry połączenia do użycia do uwierzytelniania. | No | |
| typ | onYourDataAuthenticationType | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. | Yes |
onYourDataKeyAndKeyIdAuthenticationOptions
Opcje uwierzytelniania dla usługi Azure OpenAI Na danych podczas korzystania z pary kluczy Elasticsearch i identyfikatora klucza.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| klucz | ciąg | Klucz elasticsearch do użycia do uwierzytelniania. | No | |
| key_id | ciąg | Identyfikator klucza elasticsearch do użycia do uwierzytelniania. | No | |
| typ | onYourDataAuthenticationType | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. | Yes |
onYourDataEncodedApiKeyAuthenticationOptions
Opcje uwierzytelniania usługi Azure OpenAI na danych podczas korzystania z klucza interfejsu API zakodowanego w usłudze Elasticsearch.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| encoded_api_key | ciąg | Klucz interfejsu API zakodowanego w usłudze Elasticsearch do użycia na potrzeby uwierzytelniania. | No | |
| typ | onYourDataAuthenticationType | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. | Yes |
onYourDataAccessTokenAuthenticationOptions
Opcje uwierzytelniania dla usługi Azure OpenAI Na danych podczas korzystania z tokenu dostępu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| access_token | ciąg | Token dostępu do użycia do uwierzytelniania. | No | |
| typ | onYourDataAuthenticationType | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. | Yes |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions
Opcje uwierzytelniania usługi Azure OpenAI na danych podczas korzystania z tożsamości zarządzanej przypisanej przez system.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | onYourDataAuthenticationType | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. | Yes |
onYourDataUserAssignedManagedIdentityAuthenticationOptions
Opcje uwierzytelniania dla Azure OpenAI w odniesieniu do Twoich danych, korzystając z przypisanej przez użytkownika tożsamości zarządzanej.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| managed_identity_resource_id | ciąg | Identyfikator zasobu tożsamości zarządzanej przypisanej przez użytkownika do użycia do uwierzytelniania. | No | |
| typ | onYourDataAuthenticationType | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. | Yes |
onYourDataUsernameAndPasswordAuthenticationOptions
Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data podczas korzystania z nazwy użytkownika i hasła.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| hasło | ciąg | Hasło. do użycia do uwierzytelniania. | No | |
| typ | onYourDataAuthenticationType | Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. | Yes | |
| nazwa użytkownika | ciąg | Nazwa użytkownika używana do uwierzytelniania. | No |
onYourDataVectorizationSource
Abstrakcyjna reprezentacja źródła wektoryzacji dla usługi Azure OpenAI On Your Data z wyszukiwaniem wektorowym.
Ten składnik używa właściwości type do rozróżniania różnych typów:
| Wartość typu | Schema |
|---|---|
endpoint |
onYourDataEndpointVectorizationSource |
deployment_name |
onYourDataDeploymentNameVectorizationSource |
integrated |
onYourDataIntegratedVectorizationSource |
model_id |
onYourDataModelIdVectorizationSource |
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | onYourDataVectorizationSourceType | Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. | Yes |
onYourDataVectorizationSourceType
Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym.
| Property | Value |
|---|---|
| Description | Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. |
| Type | ciąg |
| Values | endpointdeployment_nameintegratedmodel_id |
onYourDataEndpointVectorizationSource
Szczegóły źródła wektoryzacji używanego przez usługę Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego opartego na publicznym wywołaniu punktu końcowego usługi Azure OpenAI na potrzeby osadzania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| uwierzytelnianie | onYourDataApiKeyAuthenticationOptions lub onYourDataAccessTokenAuthenticationOptions | No | ||
| dimensions | liczba całkowita | Liczba wymiarów osadzania powinna mieć wartość . Obsługiwane tylko w text-embedding-3 modelach i nowszych. |
No | |
| punkt końcowy | ciąg | Określa adres URL punktu końcowego zasobu, z którego mają zostać pobrane osadzanie. Powinien mieć format https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings. Parametr zapytania w wersji interfejsu API nie jest dozwolony. |
No | |
| typ | onYourDataVectorizationSourceType | Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. | Yes |
onYourDataDeploymentNameVectorizationSource
Szczegóły źródła wektoryzacji używanego przez usługę Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego opartego na wewnętrznej nazwie wdrożenia modelu osadzania w tym samym zasobie usługi Azure OpenAI.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| deployment_name | ciąg | Określa nazwę wdrożenia modelu do użycia na potrzeby wektoryzacji. To wdrożenie modelu musi znajdować się w tym samym zasobie usługi Azure OpenAI, ale funkcja "On Your Data" będzie korzystać z tego wdrożenia modelu za pośrednictwem wywołania wewnętrznego zamiast publicznego, co umożliwia wyszukiwanie wektorów nawet w sieciach prywatnych. | No | |
| dimensions | liczba całkowita | Liczba wymiarów osadzania powinna mieć wartość . Obsługiwane tylko w text-embedding-3 modelach i nowszych. |
No | |
| typ | onYourDataVectorizationSourceType | Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. | Yes |
onYourDataIntegratedVectorizationSource
Reprezentuje zintegrowany wektoryzator zdefiniowany w ramach zasobu wyszukiwania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | onYourDataVectorizationSourceType | Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. | Yes |
onYourDataModelIdVectorizationSource
Szczegóły źródła wektoryzacji używanego przez usługę Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego opartego na identyfikatorze modelu usługi wyszukiwania. Obecnie obsługiwane tylko przez elasticsearchâ®.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| model_id | ciąg | Określa identyfikator modelu, który ma być używany do wektoryzacji. Ten identyfikator modelu musi być zdefiniowany w usłudze wyszukiwania. | No | |
| typ | onYourDataVectorizationSourceType | Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. | Yes |
azureChatExtensionsMessageContext
Reprezentacja dodatkowych informacji kontekstowych dostępnych, gdy w generowanie odpowiedzi na czat są zaangażowane rozszerzenia czatu Azure OpenAI. Te informacje kontekstowe są wypełniane tylko w przypadku używania żądania usługi Azure OpenAI skonfigurowanego do używania zgodnego rozszerzenia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| all_retrieved_documents | macierz | Wszystkie pobrane dokumenty. | No | |
| citations | macierz | Wynik pobierania źródła danych używany do generowania komunikatu asystenta w odpowiedzi. | No | |
| intencja | ciąg | Wykryta intencja z historii czatu, używana przy przejściu do następnego kroku, by przenieść kontekst. | No |
citation
informacje o cytatach dla komunikatu odpowiedzi zakończenia czatu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunk_id | ciąg | Identyfikator fragmentu cytatu. | No | |
| zawartość | ciąg | Zawartość cytatu. | Yes | |
| filepath | ciąg | Ścieżka pliku cytatu. | No | |
| rerank_score | number | Wynik ponownego generowania pobranego dokumentu. | No | |
| title | ciąg | Tytuł cytatu. | No | |
| url | ciąg | Adres URL cytatu. | No |
retrievedDocument
Pobrany dokument.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunk_id | ciąg | Identyfikator fragmentu cytatu. | No | |
| zawartość | ciąg | Zawartość cytatu. | Yes | |
| data_source_index | liczba całkowita | Indeks źródła danych. | No | |
| filepath | ciąg | Ścieżka pliku cytatu. | No | |
| filter_reason | filterReason | Przyczyna filtrowania pobranego dokumentu. | No | |
| original_search_score | number | Oryginalny wynik wyszukiwania pobranego dokumentu. | No | |
| rerank_score | number | Wynik ponownego generowania pobranego dokumentu. | No | |
| search_queries | macierz | Zapytania wyszukiwania używane do pobierania dokumentu. | No | |
| title | ciąg | Tytuł cytatu. | No | |
| url | ciąg | Adres URL cytatu. | No |
filterReason
Przyczyna filtrowania pobranego dokumentu.
| Property | Value |
|---|---|
| Description | Przyczyna filtrowania pobranego dokumentu. |
| Type | ciąg |
| Values | scorererank |
chatCompletionMessageToolCall
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| funkcja | obiekt | Funkcja, którą wywołał model. | Yes | |
| └─ Argumenty | ciąg | Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. | No | |
| └─ nazwa | ciąg | Nazwa funkcji do wywołania. | No | |
| id | ciąg | Identyfikator wywołania narzędzia. | Yes | |
| typ | toolCallType | Typ wywołania narzędzia, w tym przypadku function. |
Yes |
toolCallType
Typ wywołania narzędzia, w tym przypadku function.
| Property | Value |
|---|---|
| Description | Typ wywołania narzędzia, w tym przypadku function. |
| Type | ciąg |
| Values | function |
chatCompletionRequestMessageTool
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg | Zawartość wiadomości. | No | |
| tool_call_id | ciąg | Wywołanie narzędzia, na które odpowiada ten komunikat. | No |
chatCompletionRequestMessageFunction
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg | Zawartość wiadomości. | No | |
| name | ciąg | Zawartość wiadomości. | No | |
| rola | wyliczenie | Rola autora komunikatów, w tym przypadku function.Możliwe wartości: function |
No |
createChatCompletionResponse
Reprezentuje odpowiedź na zakończenie czatu zwróconą przez model na podstawie podanych danych wejściowych.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| choices | macierz | Lista opcji ukończenia czatu. Może być więcej niż jeden, jeśli n jest większy niż 1. |
Yes | |
| created | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) wskazująca moment utworzenia zakończenia czatu. | Yes | |
| id | ciąg | Unikatowy identyfikator ukończenia czatu. | Yes | |
| model | ciąg | Model używany do ukończenia czatu. | Yes | |
| obiekt | wyliczenie | Typ obiektu, który jest zawsze chat.completion.Możliwe wartości: chat.completion |
Yes | |
| prompt_filter_results | promptFilterResults | Wyniki filtrowania zawartości dla zera lub większej liczby monitów w żądaniu. W żądaniu przesyłania strumieniowego wyniki dla różnych poleceń mogą pojawiać się o różnych porach lub w różnej kolejności. | No | |
| system_fingerprint | ciąg | Ten odcisk palca reprezentuje zaplecze systemowe, z którym działa model. Można użyć w połączeniu z parametrem żądania seed, aby zrozumieć, kiedy wprowadzono zmiany w back-endzie, które mogą wpływać na deterministyczne działanie. |
No | |
| użycie | completionUsage | Statystyki użycia dotyczące żądania zakończenia. | No |
createChatCompletionStreamResponse
Reprezentuje fragment strumienia odpowiedzi ukończenia czatu zwróconej przez model na podstawie podanych danych wejściowych.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| choices | macierz | Lista opcji ukończenia czatu. Może zawierać więcej niż jeden element, jeśli n jest większy niż 1. |
Yes | |
| created | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) wskazująca moment utworzenia zakończenia czatu. Każdy fragment ma ten sam znacznik czasu. | Yes | |
| id | ciąg | Unikatowy identyfikator ukończenia czatu. Każdy fragment ma ten sam identyfikator. | Yes | |
| model | ciąg | Model do generowania dokończeń. | Yes | |
| obiekt | wyliczenie | Typ obiektu, który jest zawsze chat.completion.chunk.Możliwe wartości: chat.completion.chunk |
Yes | |
| system_fingerprint | ciąg | Ten odcisk palca reprezentuje zaplecze systemowe, z którym działa model. Można użyć w połączeniu z parametrem żądania seed, aby zrozumieć, kiedy wprowadzono zmiany w back-endzie, które mogą wpływać na deterministyczne działanie. |
No |
chatCompletionStreamResponseDelta
Delta ukończenia czatu wygenerowana przez przesyłane strumieniowo odpowiedzi modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg | Zawartość sekcji wiadomości. | No | |
| function_call | obiekt | Przestarzałe i zastąpione przez tool_calls. Nazwa i argumenty funkcji, które powinny być wywoływane, generowane przez model. |
No | |
| └─ Argumenty | ciąg | Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. | No | |
| └─ nazwa | ciąg | Nazwa funkcji do wywołania. | No | |
| refusal | ciąg | Komunikat o odmowie wygenerowany przez model. | No | |
| rola | wyliczenie | Rola autora tej wiadomości. Możliwe wartości: system, , user, assistanttool |
No | |
| tool_calls | macierz | No |
chatCompletionMessageToolCallChunk
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| funkcja | obiekt | No | ||
| └─ Argumenty | ciąg | Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. | No | |
| └─ nazwa | ciąg | Nazwa funkcji do wywołania. | No | |
| id | ciąg | Identyfikator wywołania narzędzia. | No | |
| indeks | liczba całkowita | Yes | ||
| typ | wyliczenie | Typ narzędzia. Obecnie obsługiwany jest tylko function.Możliwe wartości: function |
No |
chatCompletionStreamOptions
Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| include_usage | boolean | W przypadku ustawienia przed komunikatem data: [DONE] dodatkowy fragment zostanie przesłany strumieniem. Pole usage w tym fragmentzie pokazuje statystyki użycia tokenu dla całego żądania, a choices pole zawsze będzie pustą tablicą. Wszystkie inne fragmenty będą również zawierać usage pole, ale z wartością null. |
No |
chatCompletionChoiceLogProbs
Informacje o logarytmicznym prawdopodobieństwie dla wybranej opcji.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | macierz | Lista tokenów zawartości komunikatów z informacjami o prawdopodobieństwie logarytmicznym. | Yes | |
| refusal | macierz | Lista tokenów odmowy w wiadomościach z informacjami o prawdopodobieństwach logarytmicznych. | No |
chatCompletionTokenLogprob
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| bytes | macierz | Lista liczb całkowitych reprezentujących reprezentację tokenu w bajtach UTF-8. Przydatne w wystąpieniach, w których znaki są reprezentowane przez wiele tokenów, a ich reprezentacje bajtów muszą być łączone, aby wygenerować poprawną reprezentację tekstu. Może to być null , jeśli nie ma reprezentacji bajtów dla tokenu. |
Yes | |
| logprob | number | Logarytm prawdopodobieństwa tego tokenu. | Yes | |
| kod przedpłaty | ciąg | Znacznik. | Yes | |
| top_logprobs | macierz | Lista najbardziej prawdopodobnych tokenów i ich logarytmicznych prawdopodobieństw na tej pozycji tokenu. W rzadkich przypadkach może zostać zwróconych mniej elementów top_logprobs niż liczba żądanych. |
Yes |
chatCompletionResponseMessage
Komunikat ukończenia czatu wygenerowany przez model.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| audio | obiekt | Jeśli zażądano trybu wyjściowego dźwięku, ten obiekt zawiera dane dotyczące odpowiedzi dźwiękowej z modelu. | No | |
| └─ dane | ciąg | Zakodowane w formacie Base64 bajty audio generowane przez model w formacie określonym w żądaniu. |
No | |
| └─ wygasa_o | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) określająca, kiedy ta odpowiedź dźwiękowa nie będzie dostępna na serwerze do wykorzystania w konwersacjach wieloetapowych. |
No | |
| └─ ID | ciąg | Unikatowy identyfikator tej odpowiedzi audio. | No | |
| └* transkrypcja | ciąg | Transkrypcja dźwięku wygenerowanego przez model. | No | |
| zawartość | ciąg | Zawartość wiadomości. | Yes | |
| kontekst | azureChatExtensionsMessageContext | Reprezentacja dodatkowych informacji kontekstowych dostępnych, gdy w generowanie odpowiedzi na czat są zaangażowane rozszerzenia czatu Azure OpenAI. Te informacje kontekstowe są wypełniane tylko w przypadku używania żądania usługi Azure OpenAI skonfigurowanego do używania zgodnego rozszerzenia. | No | |
| function_call | chatCompletionFunctionCall | Przestarzałe i zastąpione przez tool_calls. Nazwa i argumenty funkcji, które powinny być wywoływane, generowane przez model. |
No | |
| refusal | ciąg | Komunikat o odmowie wygenerowany przez model. | Yes | |
| rola | chatCompletionResponseMessageRole | Rola autora komunikatu odpowiedzi. | Yes | |
| tool_calls | macierz | Wywołania narzędzi generowane przez model, takie jak wywołania funkcji. | No |
chatCompletionResponseMessageRole
Rola autora komunikatu odpowiedzi.
| Property | Value |
|---|---|
| Description | Rola autora komunikatu odpowiedzi. |
| Type | ciąg |
| Values | assistant |
chatCompletionToolChoiceOption
Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie wywoła żadnego narzędzia i zamiast tego generuje komunikat.
auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia.
required oznacza, że model musi wywoływać co najmniej jedno narzędzie. Określenie określonego narzędzia za pośrednictwem {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
none jest ustawieniem domyślnym, gdy żadne narzędzia nie są obecne.
auto jest wartością domyślną, jeśli istnieją narzędzia.
Ten składnik może być jednym z następujących elementów:
chatCompletionNamedToolChoice
Określa narzędzie, które ma być używane przez model. Użyj, aby wymusić, że model wywoła określoną funkcję.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| funkcja | obiekt | Yes | ||
| └─ nazwa | ciąg | Nazwa funkcji do wywołania. | No | |
| typ | wyliczenie | Typ narzędzia. Obecnie obsługiwany jest tylko function.Możliwe wartości: function |
Yes |
ParallelToolCalls
Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia.
Brak zdefiniowanych właściwości dla tego składnika.
PredictionContent
Statyczna przewidywana zawartość wyjściowa, taka jak zawartość pliku tekstowego, który jest ponownie wygenerowany.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Zawartość, która powinna być dopasowana podczas generowania odpowiedzi modelu. Jeśli wygenerowane tokeny pasują do tej zawartości, cała odpowiedź modelu może zostać zwrócona znacznie szybciej. | Yes | |
| typ | wyliczenie | Typ przewidywanej zawartości, którą chcesz podać. Ten typ jest obecnie zawsze content.Możliwe wartości: content |
Yes |
chatCompletionMessageToolCalls
Wywołania narzędzi generowane przez model, takie jak wywołania funkcji.
Brak zdefiniowanych właściwości dla tego składnika.
ChatCompletionModalities
Typy danych wyjściowych, które mają być generowane przez model dla tego żądania. Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną:
["text"]
Model gpt-4o-audio-preview może również służyć do generowania dźwięku. Aby zażądać, aby ten model wygenerował odpowiedzi tekstowe i audio, możesz użyć:
["text", "audio"]
Brak zdefiniowanych właściwości dla tego składnika.
chatCompletionFunctionCall
Przestarzałe i zastąpione przez tool_calls. Nazwa i argumenty funkcji, które powinny być wywoływane, generowane przez model.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| arguments | ciąg | Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. | Yes | |
| name | ciąg | Nazwa funkcji do wywołania. | Yes |
completionUsage
Statystyki użycia dotyczące żądania zakończenia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| completion_tokens | liczba całkowita | Liczba tokenów w wygenerowanym zakończeniu. | Yes | |
| completion_tokens_details | obiekt | Podział tokenów używanych w uzupełnieniu. | No | |
| └zaakceptowane_tokeny_predykcji | liczba całkowita | W przypadku korzystania z przewidywanych danych wyjściowych liczba tokenów w przewidywaniu, które pojawiło się w zakończeniu. | No | |
| └audio_tokens | liczba całkowita | Tokeny wejściowe audio generowane przez model. | No | |
| └─ tokeny_rozumowania | liczba całkowita | Tokeny generowane przez model do rozumowania. | No | |
| └─ odrzucone_żetony_predykcji | liczba całkowita | W przypadku korzystania z przewidywanych danych wyjściowych liczba tokenów w przewidywaniu, które nie zostały wyświetlone w zakończeniu. Jednak podobnie jak tokeny rozumowania, te tokeny są nadal liczone w łącznych tokenach ukończenia na potrzeby rozliczeń, danych wyjściowych i limitów okien kontekstowych. | No | |
| prompt_tokens | liczba całkowita | Liczba tokenów w prompt. | Yes | |
| prompt_tokens_details | obiekt | Szczegóły tokenów monitu. | No | |
| └audio_tokens | liczba całkowita | Tokeny wejściowe audio obecne w wierszu polecenia. | No | |
| └cached_tokens | liczba całkowita | Liczba buforowanych tokenów monitów. | No | |
| total_tokens | liczba całkowita | Łączna liczba tokenów użytych w żądaniu (zapytanie + ukończenie). | Yes |
chatCompletionTool
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| funkcja | FunctionObject | Yes | ||
| typ | wyliczenie | Typ narzędzia. Obecnie obsługiwany jest tylko function.Możliwe wartości: function |
Yes |
FunctionParameters
Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON. Zapoznaj się z przewodnikiem w celu poznania przykładów oraz z odniesieniem do schematu JSON dla dokumentacji dotyczącej formatu.
Pominięcie parameters definiuje funkcję z pustą listą parametrów.
Brak zdefiniowanych właściwości dla tego składnika.
FunctionObject
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| description | ciąg | Opis działania funkcji używanej przez model do wyboru, kiedy i jak wywołać funkcję. | No | |
| name | ciąg | Nazwa funkcji do wywołania. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków. | Yes | |
| parameters | FunctionParameters | Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON.
Zapoznaj się z przewodnikiem w celu poznania przykładów oraz z odniesieniem do schematu JSON dla dokumentacji dotyczącej formatu. Pominięcie parameters definiuje funkcję z pustą listą parametrów. |
No | |
| strict | boolean | Czy włączyć ścisłe przestrzeganie schematu podczas generowania wywołania funkcji. Jeśli ustawiono wartość true, model będzie postępować zgodnie z dokładnym schematem zdefiniowanym parameters w polu. Tylko podzbiór schematu JSON jest obsługiwany, gdy strict ma wartość true. |
No | False |
ResponseFormatText
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Typ zdefiniowanego formatu odpowiedzi: textMożliwe wartości: text |
Yes |
ResponseFormatJsonObject
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Typ zdefiniowanego formatu odpowiedzi: json_objectMożliwe wartości: json_object |
Yes |
ResponseFormatJsonSchemaSchema
Schemat formatu odpowiedzi, opisany jako obiekt schematu JSON.
Brak zdefiniowanych właściwości dla tego składnika.
ResponseFormatJsonSchema
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| json_schema | obiekt | Yes | ||
| Opis └* | ciąg | Opis celu formatu odpowiedzi, który jest używany przez model do określenia, jak odpowiedzieć w tym formacie. | No | |
| └─ nazwa | ciąg | Nazwa formatu odpowiedzi. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków. | No | |
| Schemat └* | ResponseFormatJsonSchemaSchema | Schemat formatu odpowiedzi, opisany jako obiekt schematu JSON. | No | |
| └* ścisłe | boolean | Czy włączyć ścisłe przestrzeganie schematu podczas generowania danych wyjściowych. W przypadku ustawienia wartości true model będzie zawsze przestrzegał dokładnego schematu zdefiniowanego schema w polu. Tylko podzbiór schematu JSON jest obsługiwany, gdy strict ma wartość true. |
No | False |
| typ | wyliczenie | Typ zdefiniowanego formatu odpowiedzi: json_schemaMożliwe wartości: json_schema |
Yes |
chatCompletionChoiceCommon
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| finish_reason | ciąg | No | ||
| indeks | liczba całkowita | No |
createTranslationRequest
Żądanie tłumaczenia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| plik | ciąg | Plik audio do tłumaczenia. | Yes | |
| monit | ciąg | Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Monit powinien być w języku angielskim. | No | |
| response_format | audioResponseFormat | Definiuje format danych wyjściowych. | No | |
| temperature | number | Temperatura próbkowania z zakresu od 0 do 1. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Jeśli ustawiono wartość 0, model używa log prawdopodobieństwa, aby automatycznie zwiększyć temperaturę, aż do momentu, gdy przekroczy określone progi. | No | 0 |
audioResponse
Odpowiedź tłumaczenia lub transkrypcji, gdy response_format był w formacie JSON
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| SMS | ciąg | Przetłumaczony lub transkrypowany tekst. | Yes |
audioVerboseResponse
Odpowiedź tłumaczenia lub transkrypcji, gdy response_format był verbose_json
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| duration | number | Duration. | No | |
| język | ciąg | Language. | No | |
| segments | macierz | No | ||
| zadanie | ciąg | Typ zadania audio. | No | |
| SMS | ciąg | Przetłumaczony lub transkrypowany tekst. | Yes | |
| words | macierz | No |
audioResponseFormat
Definiuje format danych wyjściowych.
| Property | Value |
|---|---|
| Description | Definiuje format danych wyjściowych. |
| Type | ciąg |
| Values | jsontextsrtverbose_jsonvtt |
createTranscriptionRequest
Żądanie transkrypcji.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| plik | ciąg | Obiekt pliku audio do transkrypcji. | Yes | |
| język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 zwiększa dokładność i opóźnienie. | No | |
| monit | ciąg | Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Komunikat powinien być zgodny z językiem dźwięku. | No | |
| response_format | audioResponseFormat | Definiuje format danych wyjściowych. | No | |
| temperature | number | Temperatura próbkowania z zakresu od 0 do 1. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Jeśli ustawiono wartość 0, model używa log prawdopodobieństwa, aby automatycznie zwiększyć temperaturę, aż do momentu, gdy przekroczy określone progi. | No | 0 |
| timestamp_granularities[] | macierz | Stopień szczegółowości sygnatury czasowej do wypełnienia dla tej transkrypcji.
response_format należy ustawić, verbose_json aby używać szczegółowości sygnatury czasowej. Obsługiwane są obie te opcje: word, lub segment. Uwaga: nie ma dodatkowego opóźnienia dla znaczników czasu segmentu, ale generowanie znaczników czasu dla wyrazów powoduje dodatkowe opóźnienie. |
No | ['segment'] |
audioSegment
Transkrypcja lub część tłumaczenia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| avg_logprob | number | Średnie logarytmiczne prawdopodobieństwo. | No | |
| compression_ratio | number | Współczynnik sprężania. | No | |
| end | number | Przesunięcie końcowe segmentu. | No | |
| id | liczba całkowita | Identyfikator segmentu. | No | |
| no_speech_prob | number | Prawdopodobieństwo braku mowy. | No | |
| seek | number | Przesunięcie segmentu. | No | |
| start | number | Przesunięcie rozpoczęcia segmentu. | No | |
| temperature | number | Temperature. | No | |
| SMS | ciąg | Tekst segmentu. | No | |
| tokens | macierz | Tokeny tekstu. | No |
audioWord
Transkrypcja lub słowo translacji.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| end | number | Przesunięcie końcowe programu Word. | No | |
| start | number | Przesunięcie rozpoczęcia programu Word. | No | |
| słowo | ciąg | Word | No |
createSpeechRequest
Żądanie mowy.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane wejściowe | ciąg | Tekst do syntezowania dźwięku. Maksymalna długość to 4096 znaków. | Yes | |
| response_format | wyliczenie | Format syntetyzowania dźwięku. Możliwe wartości: mp3, , opusaac, flac, , wavpcm |
No | |
| speed | number | Szybkość syntetyzowanego dźwięku. Wybierz wartość z 0.25 do 4.0.
1.0 jest wartością domyślną. |
No | 1.0 |
| voice | wyliczenie | Głos używany do syntezy mowy. Możliwe wartości: alloy, , echofable, onyx, , novashimmer |
Yes |
imageQuality
Jakość obrazu, który zostanie wygenerowany.
| Property | Value |
|---|---|
| Description | Jakość obrazu, który zostanie wygenerowany. |
| Type | ciąg |
| Default | auto |
| Values | autohighmediumlowhdstandard |
imagesResponseFormat
Format, w którym są zwracane wygenerowane obrazy.
| Property | Value |
|---|---|
| Description | Format, w którym są zwracane wygenerowane obrazy. |
| Type | ciąg |
| Default | url |
| Values | urlb64_json |
imagesOutputFormat
Format pliku, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko w przypadku modeli serii.
| Property | Value |
|---|---|
| Description | Format pliku, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko w przypadku modeli serii gpt-image-1. |
| Type | ciąg |
| Default | png |
| Values | pngjpeg |
imageSize
Rozmiar wygenerowanych obrazów.
| Property | Value |
|---|---|
| Description | Rozmiar wygenerowanych obrazów. |
| Type | ciąg |
| Default | auto |
| Values | auto1792x10241024x17921024x10241024x15361536x1024 |
imageStyle
Styl wygenerowanych obrazów. Obsługiwane tylko dla dall-e-3.
| Property | Value |
|---|---|
| Description | Styl wygenerowanych obrazów. Obsługiwane tylko dla dall-e-3. |
| Type | ciąg |
| Default | vivid |
| Values | vividnatural |
imageBackground
Umożliwia ustawienie przezroczystości tła wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1.
| Property | Value |
|---|---|
| Description | Umożliwia ustawienie przezroczystości tła wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1. |
| Type | ciąg |
| Default | auto |
| Values | transparentopaqueauto |
imageGenerationsRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| tło | imageBackground | Umożliwia ustawienie przezroczystości tła wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1. | No | auto |
| n | liczba całkowita | Liczba obrazów do wygenerowania. Obsługiwane jest tylko n=1 dla dall-e-3. | No | 1 |
| output_compression | liczba całkowita | Poziom kompresji (0–100%) dla wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1 z formatem danych wyjściowych jpeg. | No | 100 |
| output_format | imagesOutputFormat | Format pliku, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko w przypadku modeli serii gpt-image-1. | No | png |
| monit | ciąg | Opis tekstu żądanych obrazów. Maksymalna długość to 32000 znaków dla modeli serii gpt-image-1 i 4000 znaków dla dall-e-3 | Yes | |
| quality | imageQuality | Jakość obrazu, który zostanie wygenerowany. | No | auto |
| response_format | imagesResponseFormat | Format, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko dla dall-e-3. | No | url |
| size | imageSize | Rozmiar wygenerowanych obrazów. | No | auto |
| styl | imageStyle | Styl wygenerowanych obrazów. Obsługiwane tylko dla dall-e-3. | No | vivid |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. | No |
imageEditsRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| obraz | ciąg lub tablica | Obrazy do edycji. Musi być obsługiwanym plikiem obrazu lub tablicą obrazów. Każdy obraz powinien być plikiem png lub jpg mniejszym niż 25 MB. | Yes | |
| maska | ciąg | Dodatkowy obraz, którego w pełni przezroczyste obszary (np. alfa ma wartość zero) wskazują, gdzie ma być edytowany obraz. Jeśli dostępnych jest wiele obrazów, maska zostanie zastosowana do pierwszego obrazu. Musi być prawidłowym plikiem PNG, mniejszym niż 4 MB i mieć takie same wymiary jak obraz. | No | |
| n | liczba całkowita | Liczba obrazów do wygenerowania. | No | 1 |
| monit | ciąg | Opis tekstu żądanych obrazów. Maksymalna długość to 32000 znaków. | Yes | |
| quality | imageQuality | Jakość obrazu, który zostanie wygenerowany. | No | auto |
| response_format | imagesResponseFormat | Format, w którym są zwracane wygenerowane obrazy. | No | url |
| size | imageSize | Rozmiar wygenerowanych obrazów. | No | auto |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. | No |
generateImagesResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| created | liczba całkowita | Sygnatura czasowa systemu unix podczas tworzenia operacji. | Yes | |
| dane | macierz | Dane wynikowe operacji, jeśli operacja zakończyła się pomyślnie | Yes | |
| użycie | imageGenerationsUsage | Reprezentuje szczegóły użycia tokenu dla żądań generowania obrazów. Tylko w przypadku modeli serii gpt-image-1. | No |
imageResult
Adres URL obrazu lub zakodowany obraz, jeśli się powiedzie, i błąd w przeciwnym razie.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| b64_json | ciąg | Obraz zakodowany w formacie base64 | No | |
| content_filter_results | dalleContentFilterResults | Informacje o wynikach filtrowania zawartości. | No | |
| prompt_filter_results | dalleFilterResults | Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator. | No | |
| revised_prompt | ciąg | Polecenie, które zostało użyte do wygenerowania obrazu, jeśli dokonano jakiejkolwiek poprawki do podpowiedzi. | No | |
| url | ciąg | Adres URL obrazu. | No |
imageGenerationsUsage
Reprezentuje szczegóły użycia tokenu dla żądań generowania obrazów. Tylko w przypadku modeli serii gpt-image-1.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| input_tokens | liczba całkowita | Liczba tokenów wejściowych. | No | |
| input_tokens_details | obiekt | Szczegółowy podział tokenów wejściowych. | No | |
| └image_tokens | liczba całkowita | Liczba tokenów obrazu. | No | |
| └ text_tokens | liczba całkowita | Liczba tokenów tekstowych. | No | |
| output_tokens | liczba całkowita | Liczba tokenów wyjściowych. | No | |
| total_tokens | liczba całkowita | Całkowita liczba użytych tokenów. | No |
linia
Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| spans | macierz | Tablica zakresów reprezentujących wykryte obiekty i informacje o polu ograniczenia. | Yes | |
| SMS | ciąg | Yes |
span
Obiekt span reprezentujący wykryty obiekt i informacje o polu ograniczenia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| length | liczba całkowita | Długość zakresu w znakach mierzona w punktach kodu Unicode. | Yes | |
| przesunąć | liczba całkowita | Przesunięcie znaku w tekście, na którym rozpoczyna się zakres. To przesunięcie jest definiowane jako pozycja pierwszego znaku zakresu, licząc od początku tekstu jako punkty kodowe Unicode. | Yes | |
| polygon | macierz | Tablica obiektów reprezentujących punkty w wielokącie, który otacza wykryty obiekt. | Yes | |
| SMS | ciąg | Zawartość tekstowa zakresu reprezentująca wykryty obiekt. | Yes |
runCompletionUsage
Statystyki użycia związane z uruchomieniem. Ta wartość będzie taka null , jeśli przebieg nie znajduje się w stanie terminalu (np. in_progress, queueditp.).
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| completion_tokens | liczba całkowita | Liczba tokenów ukończenia używanych w trakcie przebiegu. | Yes | |
| prompt_tokens | liczba całkowita | Liczba tokenów monitu używanych w trakcie przebiegu. | Yes | |
| total_tokens | liczba całkowita | Łączna liczba użytych tokenów (monit i ukończenie). | Yes |
runStepCompletionUsage
Statystyki użycia związane z krokiem uruchamiania. Ta wartość będzie mieć null stan , gdy stan kroku uruchomienia to in_progress.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| completion_tokens | liczba całkowita | Liczba tokenów ukończenia używanych w trakcie kroku uruchamiania. | Yes | |
| prompt_tokens | liczba całkowita | Liczba tokenów monitu używanych w trakcie kroku uruchamiania. | Yes | |
| total_tokens | liczba całkowita | Łączna liczba użytych tokenów (monit i ukończenie). | Yes |
assistantsApiResponseFormatOption
Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.
Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.
Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.
Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
Ten składnik może być jednym z następujących elementów:
assistantsApiResponseFormat
Obiekt opisujący oczekiwane dane wyjściowe modelu. Jeśli json_object tylko typ function może zostać przekazany do tools przebiegu. Jeśli text model może zwrócić tekst lub dowolną wymaganą wartość.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | ciąg | Musi być jednym z text lub json_object. |
No | SMS |
typ Enum: AssistantsApiResponseFormat
| Value | Description |
|---|---|
| SMS | |
| json_object |
assistantObject
Reprezentuje element assistant , który może wywoływać model i używać narzędzi.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| created_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia asystenta. | Yes | |
| description | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
Yes | |
| id | ciąg | Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. | Yes | |
| instructions | ciąg | Instrukcje systemowe używane przez asystenta. Maksymalna długość to 256 000 znaków. |
Yes | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
Yes | |
| model | ciąg | Identyfikator modelu do użycia. | Yes | |
| name | ciąg | Nazwa asystenta. Maksymalna długość to 256 znaków. |
Yes | |
| obiekt | ciąg | Typ obiektu, który jest zawsze assistant. |
Yes | |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Identyfikator magazynu wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta. |
No | |
| tools | macierz | Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, file_searchlub function. |
Yes | [] |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu. |
No | 1 |
object Enum: AssistantObjectType
| Value | Description |
|---|---|
| asystent | Typ obiektu, który jest zawsze asystentem |
createAssistantRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| description | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
No | |
| instructions | ciąg | Instrukcje systemowe używane przez asystenta. Maksymalna długość to 256 000 znaków. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| model | ciąg | Yes | ||
| name | ciąg | Nazwa asystenta. Maksymalna długość to 256 znaków. |
No | |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta. |
No | |
| └─ przechowalnie_wektorów | macierz | Pomocnik do tworzenia magazynu wektorów z file_ids i dołączania go do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta. |
No | |
| tools | macierz | Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, retrievallub function. |
No | [] |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu. |
No | 1 |
modifyAssistantRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| description | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
No | |
| instructions | ciąg | Instrukcje systemowe używane przez asystenta. Maksymalna długość to 32768 znaków. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| model | ciąg | No | ||
| name | ciąg | Nazwa asystenta. Maksymalna długość to 256 znaków. |
No | |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Zastępuje listę identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Zastępuje magazyn wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta. |
No | |
| tools | macierz | Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, retrievallub function. |
No | [] |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu. |
No | 1 |
deleteAssistantResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| deleted | boolean | Yes | ||
| id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
object Enum: DeleteAssistantResponseState
| Value | Description |
|---|---|
| assistant.deleted |
listAssistantsResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Yes | ||
| first_id | ciąg | Yes | ||
| has_more | boolean | Yes | ||
| last_id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
assistantToolsCode
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | ciąg | Typ zdefiniowanego narzędzia: code_interpreter |
Yes |
typ Enum: assistantToolsCodeType
| Value | Description |
|---|---|
| code_interpreter |
assistantToolsFileSearch
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| file_search | obiekt | Zastępuje narzędzie do wyszukiwania plików. | No | |
| └max_num_results | liczba całkowita | Maksymalna liczba wyników, które narzędzie wyszukiwania plików powinno wyświetlić. Wartość domyślna to 20 dla modeli gpt-4* i 5 dla gpt-3,5-turbo. Ta liczba powinna należeć do zakresu od 1 do 50 włącznie. Należy pamiętać, że narzędzie wyszukiwania plików może zwracać mniej niż max_num_results wyniki. |
No | |
| typ | ciąg | Typ zdefiniowanego narzędzia: file_search |
Yes |
type Enum: typWyszukiwaniaPlikówNarzędziAsystenta
| Value | Description |
|---|---|
| file_search |
assistantToolsFileSearchTypeOnly
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | ciąg | Typ zdefiniowanego narzędzia: file_search |
Yes |
type Enum: typWyszukiwaniaPlikówNarzędziAsystenta
| Value | Description |
|---|---|
| file_search |
assistantToolsFunction
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| funkcja | obiekt | Definicja funkcji. | Yes | |
| Opis └* | ciąg | Opis działania funkcji używanej przez model do wyboru, kiedy i jak wywołać funkcję. | No | |
| └─ nazwa | ciąg | Nazwa funkcji do wywołania. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków. | No | |
| Parametry | chatCompletionFunctionParameters | Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON. Zapoznaj się z przewodnikiem/, aby zapoznać się z przykładami, oraz dokumentacją dotyczącą schematu JSON, aby uzyskać dokumentację dotyczącą formatu. | No | |
| typ | ciąg | Typ zdefiniowanego narzędzia: function |
Yes |
type Enum: assistantToolsFunction
| Value | Description |
|---|---|
| funkcja |
truncationObject
Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| last_messages | liczba całkowita | Liczba najnowszych komunikatów z wątku podczas konstruowania kontekstu przebiegu. | No | |
| typ | ciąg | Strategia obcinania do użycia dla wątku. Wartość domyślna to auto. Jeśli ustawiono wartość last_messages, wątek zostanie obcięty do n najnowszych komunikatów w wątku. Po ustawieniu autowartości na wartość komunikaty w środku wątku zostaną porzucone w celu dopasowania do długości kontekstu modelu . max_prompt_tokens |
Yes |
typ Enum: TruncationType
| Value | Description |
|---|---|
| auto | |
| last_messages |
assistantsApiToolChoiceOption
Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie będzie wywoływać żadnych narzędzi i zamiast tego generuje komunikat.
auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.
Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
Ten składnik może być jednym z następujących elementów:
assistantsNamedToolChoice
Określa narzędzie, które ma być używane przez model. Użyj polecenia , aby wymusić wywołanie określonego narzędzia przez model.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| funkcja | obiekt | No | ||
| └─ nazwa | ciąg | Nazwa funkcji do wywołania. | No | |
| typ | ciąg | Typ narzędzia. Jeśli typ to function, należy ustawić nazwę funkcji |
Yes |
typ Enumowy: AssistantsNamedToolChoiceType
| Value | Description |
|---|---|
| funkcja | |
| code_interpreter | |
| file_search |
runObject
Reprezentuje przebieg wykonywania w wątkach.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| assistant_id | ciąg | Identyfikator asystenta używanego do wykonywania tego przebiegu. | Yes | |
| cancelled_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu anulowania przebiegu. | Yes | |
| completed_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu ukończenia przebiegu. | Yes | |
| created_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia przebiegu. | Yes | |
| expires_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla czasu wygaśnięcia przebiegu. | Yes | |
| failed_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla czasu niepowodzenia uruchomienia. | Yes | |
| id | ciąg | Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. | Yes | |
| incomplete_details | obiekt | Szczegółowe informacje o tym, dlaczego przebieg jest niekompletny. Będzie to null , jeśli przebieg nie jest niekompletny. |
Yes | |
| └* przyczyna | ciąg | Powód, dla którego przebieg jest niekompletny. Będzie to wskazywać, który limit tokenów został osiągnięty w trakcie przebiegu. | No | |
| instructions | ciąg | Instrukcje używane przez asystenta do tego przebiegu. | Yes | |
| last_error | obiekt | Ostatni błąd skojarzony z tym przebiegiem. Jeśli nie ma żadnych błędów, będzie występować null błąd. |
Yes | |
| └─ kod | ciąg | Jeden z server_error lub rate_limit_exceeded. |
No | |
| └─ Komunikat | ciąg | Czytelny dla człowieka opis błędu. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia określonych do użycia w trakcie przebiegu. |
Yes | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów monitów określonych do użycia w trakcie przebiegu. |
Yes | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
Yes | |
| model | ciąg | Model używany przez asystenta na potrzeby tego przebiegu. | Yes | |
| obiekt | ciąg | Typ obiektu, który jest zawsze thread.run. |
Yes | |
| parallel_tool_calls | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. | No | True |
| required_action | obiekt | Szczegółowe informacje na temat akcji wymaganej do kontynuowania przebiegu. Będzie to null , jeśli nie jest wymagana żadna akcja. |
Yes | |
| └submit_tool_outputs | obiekt | Szczegółowe informacje na temat danych wyjściowych narzędzia potrzebnych do kontynuowania tego przebiegu. | No | |
| └tool_calls | macierz | Lista odpowiednich wywołań narzędzi. | No | |
| └typ | wyliczenie | Na razie jest to zawsze submit_tool_outputs.Możliwe wartości: submit_tool_outputs |
No | |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
Yes | |
| started_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu uruchomienia przebiegu. | Yes | |
| stan | ciąg | Stan przebiegu, który może mieć queuedwartość , , in_progress, requires_actioncancellingcancelledfailed, completedlub .expired |
Yes | |
| temperature | number | Temperatura próbkowania używana na potrzeby tego przebiegu. Jeśli nie zostanie ustawiona, wartość domyślna to 1. | No | |
| thread_id | ciąg | Identyfikator wątków, na których zostało wykonane to uruchomienie. | Yes | |
| tool_choice | assistantsApiToolChoiceOption | Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.none oznacza, że model nie będzie wywoływać żadnych narzędzi i zamiast tego generuje komunikat.auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model. |
Yes | |
| tools | macierz | Lista narzędzi używanych przez asystenta do tego przebiegu. | Yes | [] |
| top_p | number | Wartość próbkowania jądra użyta na potrzeby tego przebiegu. Jeśli nie zostanie ustawiona, wartość domyślna to 1. | No | |
| truncation_strategy | truncationObject | Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. | Yes | |
| użycie | runCompletionUsage | Statystyki użycia związane z uruchomieniem. Ta wartość będzie taka null , jeśli przebieg nie znajduje się w stanie terminalu (np. in_progress, queueditp.). |
Yes |
object Enum: runObjectType
| Value | Description |
|---|---|
| thread.run | Typ obiektu przebiegu, który jest zawsze thread.run |
status Enum: StatusUruchomieniaObiektu
| Value | Description |
|---|---|
| w kolejce | Stan w kolejce |
| in_progress | Stan in_progress |
| requires_action | Stan required_action |
| cancelling | Stan anulowania |
| cancelled | Stan anulowany |
| failed | Stan niepowodzenia |
| completed | Stan ukończony |
| expired | Stan wygasły |
createRunRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| additional_instructions | ciąg | Dołącza dodatkowe instrukcje na końcu instrukcji dotyczących przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów bez zastępowania innych instrukcji. | No | |
| additional_messages | macierz | Dodaje dodatkowe komunikaty do wątku przed utworzeniem przebiegu. | No | |
| assistant_id | ciąg | Identyfikator asystenta do wykonania tego przebiegu. | Yes | |
| instructions | ciąg | Zastąpi domyślny komunikat systemowy asystenta. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia, które mogą być używane w trakcie przebiegu. Uruchomienie dokłada wszelkich starań, aby używać tylko określonej liczby tokenów ukończenia w wielu etapach uruchomienia. Jeśli przebieg przekroczy określoną liczbę tokenów ukończenia, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details. |
No | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów monitów, które mogą być używane w trakcie przebiegu. Przebieg dokłada wszelkich starań, aby używać tylko określonej liczby tokenów monitu podczas wielu cykli przebiegu. Jeśli przebieg przekroczy określoną liczbę tokenów monitu, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| model | ciąg | Identyfikator modelu, który ma być używany do wykonania tego przebiegu. Jeśli w tym miejscu zostanie podana wartość, zastąpi ona model skojarzony z asystentem. Jeśli nie, zostanie użyty model skojarzony z asystentem. | No | |
| parallel_tool_calls | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. | No | True |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| odtwarzać strumieniowo | boolean | Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] . |
No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. |
No | 1 |
| tool_choice | assistantsApiToolChoiceOption | Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.none oznacza, że model nie będzie wywoływać żadnych narzędzi i zamiast tego generuje komunikat.auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model. |
No | |
| tools | macierz | Zastąpić narzędzia, których asystent może użyć na potrzeby tego przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. | No | |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu. |
No | 1 |
| truncation_strategy | truncationObject | Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. | No |
listRunsResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Yes | ||
| first_id | ciąg | Yes | ||
| has_more | boolean | Yes | ||
| last_id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
modifyRunRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No |
submitToolOutputsRunRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| odtwarzać strumieniowo | boolean | Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] . |
No | |
| tool_outputs | macierz | Lista narzędzi, dla których są przesyłane dane wyjściowe. | Yes |
runToolCallObject
Obiekty wywołania narzędzi
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| funkcja | obiekt | Definicja funkcji. | Yes | |
| └─ Argumenty | ciąg | Argumenty, które model oczekuje przekazania do funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji. | No | |
| id | ciąg | Identyfikator wywołania narzędzia. Ten identyfikator należy przywoływać podczas przesyłania wyników narzędzia przy użyciu funkcji przesyłania wyników do uruchomienia punktu końcowego. | Yes | |
| typ | ciąg | Typ narzędzia wywołującego dane wyjściowe jest wymagany. Na razie jest to zawsze function. |
Yes |
Typ Enum: RunToolCallObjectType
| Value | Description |
|---|---|
| funkcja |
createThreadAndRunRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| assistant_id | ciąg | Identyfikator asystenta do wykonania tego przebiegu. | Yes | |
| instructions | ciąg | Zastąpi domyślny komunikat systemowy asystenta. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia, które mogą być używane w trakcie przebiegu. Uruchomienie dokłada wszelkich starań, aby używać tylko określonej liczby tokenów ukończenia w wielu etapach uruchomienia. Jeśli przebieg przekroczy określoną liczbę tokenów ukończenia, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details. |
No | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów monitów, które mogą być używane w trakcie przebiegu. Przebieg dokłada wszelkich starań, aby używać tylko określonej liczby tokenów monitu podczas wielu cykli przebiegu. Jeśli przebieg przekroczy określoną liczbę tokenów monitu, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| model | ciąg | Identyfikator modeli, które mają być wykorzystane do wykonania tego zadania. Jeśli w tym miejscu zostanie podana wartość, zastąpi ona model skojarzony z asystentem. Jeśli nie, zostanie użyty model skojarzony z asystentem. | No | |
| parallel_tool_calls | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. | No | True |
| response_format | assistantsApiResponseFormatOption | Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| odtwarzać strumieniowo | boolean | Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] . |
No | |
| stream_options | chatCompletionStreamOptions | Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true. |
No | None |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. |
No | 1 |
| konwersacja | createThreadRequest | No | ||
| tool_choice | assistantsApiToolChoiceOption | Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.none oznacza, że model nie będzie wywoływać żadnych narzędzi i zamiast tego generuje komunikat.auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model. |
No | |
| tool_resources | obiekt | Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Identyfikator magazynu wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta. |
No | |
| tools | macierz | Zastąpić narzędzia, których asystent może użyć na potrzeby tego przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. | No | |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu. |
No | 1 |
| truncation_strategy | truncationObject | Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. | No |
threadObject
Reprezentuje wątek zawierający komunikaty.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| created_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia wątku. | Yes | |
| id | ciąg | Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. | Yes | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
Yes | |
| obiekt | ciąg | Typ obiektu, który jest zawsze thread. |
Yes | |
| tool_resources | obiekt | Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
Yes | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku. |
No |
object Enum: ThreadObjectType
| Value | Description |
|---|---|
| konwersacja | Typ obiektu wątku, który jest zawsze thread |
createThreadRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| messages | macierz | Lista komunikatów, z których chcesz rozpocząć wątek. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| tool_resources | obiekt | Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku. |
No | |
| └─ przechowalnie_wektorów | macierz | Pomocnik do tworzenia magazynu wektorów z file_ids i dołączania go do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku. |
No |
modifyThreadRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| tool_resources | obiekt | Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku. |
No |
deleteThreadResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| deleted | boolean | Yes | ||
| id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
object Enum: DeleteThreadResponseObjectState
| Value | Description |
|---|---|
| thread.deleted | Stan obiektu odpowiedzi usuwania wątku, który jest thread.deleted |
listThreadsResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Yes | ||
| first_id | ciąg | Yes | ||
| has_more | boolean | Yes | ||
| last_id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
messageObject
Reprezentuje wiadomość w ramach wątków.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| assistant_id | ciąg | Jeśli ma to zastosowanie, identyfikator asystenta, który napisał tę wiadomość. | Yes | |
| attachments | macierz | Lista plików dołączonych do wiadomości i narzędzi, do których zostały dodane. | Yes | |
| completed_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu zakończenia komunikatu. | Yes | |
| zawartość | macierz | Zawartość wiadomości w tablicy tekstu i/lub obrazów. | Yes | |
| created_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia komunikatu. | Yes | |
| id | ciąg | Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. | Yes | |
| incomplete_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu, gdy komunikat został oznaczony jako niekompletny. | Yes | |
| incomplete_details | obiekt | W niekompletnej wiadomości szczegółowe informacje o tym, dlaczego wiadomość jest niekompletna. | Yes | |
| └* przyczyna | ciąg | Przyczyna, dla którego komunikat jest niekompletny. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
Yes | |
| obiekt | ciąg | Typ obiektu, który jest zawsze thread.message. |
Yes | |
| rola | ciąg | Jednostka, która wygenerowała komunikat. Jeden z user lub assistant. |
Yes | |
| run_id | ciąg | Jeśli ma to zastosowanie, identyfikator przebiegu skojarzonego z tworzeniem tego komunikatu. | Yes | |
| stan | ciąg | Stan komunikatu, który może mieć in_progresswartość , incompletelub completed. |
Yes | |
| thread_id | ciąg | Identyfikator wątków, do którego należy ten komunikat. | Yes |
object Enum: TypObiektuWiadomości
| Value | Description |
|---|---|
| thread.message | Typ obiektu komunikatu, który jest thread.message |
Enum statusu: Status obiektu wiadomości
| Value | Description |
|---|---|
| in_progress | |
| incomplete | |
| completed |
rola Enum: RolaObiektuWiadomości
| Value | Description |
|---|---|
| użytkownik | |
| asystent |
messageDeltaObject
Reprezentuje różnicę komunikatów, tj. wszystkie zmienione pola w wiadomości podczas przesyłania strumieniowego.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| delta | obiekt | Delta zawierająca pola, które uległy zmianie w komunikacie. | Yes | |
| └─ zawartość | macierz | Zawartość wiadomości w tablicy tekstu i/lub obrazów. | No | |
| └─ Rola | ciąg | Jednostka, która wygenerowała komunikat. Jeden z user lub assistant. |
No | |
| id | ciąg | Identyfikator komunikatu, do którego można się odwoływać w punktach końcowych interfejsu API. | Yes | |
| obiekt | ciąg | Typ obiektu, który jest zawsze thread.message.delta. |
Yes |
obiekt Enum: MessageDeltaObjectType
| Value | Description |
|---|---|
| thread.message.delta |
createMessageRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| attachments | macierz | Lista plików dołączonych do wiadomości oraz narzędzia, do których należy je dodać. | No | |
| zawartość | ciąg | Zawartość wiadomości. | Yes | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| rola | ciąg | Rola jednostki tworzącej komunikat. Dozwolone wartości obejmują: - user: wskazuje, że komunikat jest wysyłany przez rzeczywistego użytkownika i powinien być używany w większości przypadków do reprezentowania komunikatów generowanych przez użytkownika.- assistant: wskazuje, że komunikat jest generowany przez asystenta. Użyj tej wartości, aby wstawić wiadomości z asystenta do konwersacji. |
Yes |
role Enum: CreateMessageRequestRole
| Value | Description |
|---|---|
| użytkownik | |
| asystent |
modifyMessageRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No |
deleteMessageResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| deleted | boolean | Yes | ||
| id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
object Enum: DeleteMessageResponseObject
| Value | Description |
|---|---|
| thread.message.deleted | Stan obiektu odpowiedzi komunikatu usuwania |
listMessagesResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Yes | ||
| first_id | ciąg | Yes | ||
| has_more | boolean | Yes | ||
| last_id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
messageContentImageFileObject
Odwołuje się do pliku obrazu w zawartości komunikatu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| image_file | obiekt | Yes | ||
| └ file_id | ciąg | Identyfikator pliku obrazu w zawartości wiadomości. | No | |
| typ | ciąg | Zawsze image_file. |
Yes |
type Enum: MessageContentImageFileObjectType
| Value | Description |
|---|---|
| image_file | Typ pliku obrazu zawartości wiadomości |
messageContentTextObject
Zawartość tekstowa, która jest częścią wiadomości.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| SMS | obiekt | Yes | ||
| └* adnotacje | macierz | No | ||
| └─ wartość | ciąg | Dane tworzące tekst. | No | |
| typ | ciąg | Zawsze text. |
Yes |
type Enum: TypObiektuTekstowegoTreściWiadomości
| Value | Description |
|---|---|
| SMS | Typ obiektu zawartości wiadomości |
messageContentTextAnnotationsFileCitationObject
Cytat w komunikacie wskazujący określony cudzysłów z określonego pliku skojarzonego z asystentem lub komunikatem. Generowane, gdy asystent używa narzędzia "pobieranie" do wyszukiwania plików.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| end_index | liczba całkowita | Yes | ||
| file_citation | obiekt | Yes | ||
| └ file_id | ciąg | Identyfikator określonego pliku, z których pochodzi cytat. | No | |
| start_index | liczba całkowita | Yes | ||
| SMS | ciąg | Tekst w zawartości wiadomości, który musi zostać zastąpiony. | Yes | |
| typ | ciąg | Zawsze file_citation. |
Yes |
typ Enum: FileCitationObjectType
| Value | Description |
|---|---|
| file_citation | Typ obiektu cytatu pliku |
messageContentTextAnnotationsFilePathObject
Adres URL pliku, który jest generowany, gdy asystent użył code_interpreter narzędzia do wygenerowania pliku.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| end_index | liczba całkowita | Yes | ||
| file_path | obiekt | Yes | ||
| └ file_id | ciąg | Identyfikator wygenerowanego pliku. | No | |
| start_index | liczba całkowita | Yes | ||
| SMS | ciąg | Tekst w zawartości wiadomości, który musi zostać zastąpiony. | Yes | |
| typ | ciąg | Zawsze file_path. |
Yes |
typ Enum: FilePathObjectType
| Value | Description |
|---|---|
| file_path | Typ obiektu ścieżki pliku |
messageDeltaContentImageFileObject
Odwołuje się do pliku obrazu w zawartości komunikatu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| image_file | obiekt | No | ||
| └ file_id | ciąg | Identyfikator pliku obrazu w zawartości wiadomości. | No | |
| indeks | liczba całkowita | Indeks części zawartości w komunikacie. | Yes | |
| typ | ciąg | Zawsze image_file. |
Yes |
type Enum: MessageDeltaContentImageFileObjectType
| Value | Description |
|---|---|
| image_file |
messageDeltaContentTextObject
Zawartość tekstowa, która jest częścią wiadomości.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| indeks | liczba całkowita | Indeks części zawartości w komunikacie. | Yes | |
| SMS | obiekt | No | ||
| └* adnotacje | macierz | No | ||
| └─ wartość | ciąg | Dane tworzące tekst. | No | |
| typ | ciąg | Zawsze text. |
Yes |
type Enum: MessageDeltaContentTextObjectType
| Value | Description |
|---|---|
| SMS |
messageDeltaContentTextAnnotationsFileCitationObject
Cytat w komunikacie wskazujący określony cudzysłów z określonego pliku skojarzonego z asystentem lub komunikatem. Generowane, gdy asystent używa narzędzia "file_search" do wyszukiwania plików.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| end_index | liczba całkowita | No | ||
| file_citation | obiekt | No | ||
| └ file_id | ciąg | Identyfikator określonego pliku, z których pochodzi cytat. | No | |
| └cudzysłów | ciąg | Konkretny cudzysłów w pliku. | No | |
| indeks | liczba całkowita | Indeks adnotacji w części zawartości tekstowej. | Yes | |
| start_index | liczba całkowita | No | ||
| SMS | ciąg | Tekst w zawartości wiadomości, który musi zostać zastąpiony. | No | |
| typ | ciąg | Zawsze file_citation. |
Yes |
type Enum: MessageDeltaContentTextAnnotationsFileCitationObjectType
| Value | Description |
|---|---|
| file_citation |
messageDeltaContentTextAnnotationsFilePathObject
Adres URL pliku, który jest generowany, gdy asystent użył code_interpreter narzędzia do wygenerowania pliku.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| end_index | liczba całkowita | No | ||
| file_path | obiekt | No | ||
| └ file_id | ciąg | Identyfikator wygenerowanego pliku. | No | |
| indeks | liczba całkowita | Indeks adnotacji w części zawartości tekstowej. | Yes | |
| start_index | liczba całkowita | No | ||
| SMS | ciąg | Tekst w zawartości wiadomości, który musi zostać zastąpiony. | No | |
| typ | ciąg | Zawsze file_path. |
Yes |
type Enum: MessageDeltaContentTextAnnotationsFilePathObjectType
| Value | Description |
|---|---|
| file_path |
runStepObject
Reprezentuje krok wykonywania przebiegu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| assistant_id | ciąg | Identyfikator asystenta skojarzonego z krokiem uruchamiania. | Yes | |
| cancelled_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu anulowania kroku uruchamiania. | Yes | |
| completed_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu ukończenia kroku uruchamiania. | Yes | |
| created_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia kroku uruchamiania. | Yes | |
| expired_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla czasu wygaśnięcia kroku uruchamiania. Krok jest uznawany za wygasły, jeśli uruchomienie nadrzędne wygasło. | Yes | |
| failed_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu niepowodzenia kroku uruchamiania. | Yes | |
| id | ciąg | Identyfikator kroku uruchamiania, do którego można odwoływać się w punktach końcowych interfejsu API. | Yes | |
| last_error | obiekt | Ostatni błąd skojarzony z tym krokiem przebiegu. Jeśli nie ma żadnych błędów, będzie występować null błąd. |
Yes | |
| └─ kod | ciąg | Jeden z server_error lub rate_limit_exceeded. |
No | |
| └─ Komunikat | ciąg | Czytelny dla człowieka opis błędu. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
Yes | |
| obiekt | ciąg | Typ obiektu, który jest zawsze assistant.run.step. |
Yes | |
| run_id | ciąg | Identyfikator przebiegu, którego dotyczy ten krok przebiegu, jest częścią. | Yes | |
| stan | ciąg | Stan przebiegu, który może mieć wartość in_progress, , cancelledfailed, completedlub expired. |
Yes | |
| step_details | runStepDetailsMessageCreationObject lub runStepDetailsToolCallsObject | Szczegóły kroku uruchamiania. | Yes | |
| thread_id | ciąg | Identyfikator uruchomionych wątków. | Yes | |
| typ | ciąg | Typ kroku uruchamiania, który może mieć message_creation wartość lub tool_calls. |
Yes |
object Enum: RunStepObjectType
| Value | Description |
|---|---|
| assistant.run.step | Typ obiektu, który jest zawsze assistant.run.step |
type Enum: RunStepObjectType
| Value | Description |
|---|---|
| message_creation | Krok uruchamiania message_creation |
| tool_calls | Krok uruchamiania tool_calls |
Status Enum: RunStepObjectStatus
| Value | Description |
|---|---|
| in_progress | Stan uruchomienia in_progress |
| cancelled | Stan anulowanego uruchomienia |
| failed | Stan anulowanego uruchomienia |
| completed | Stan anulowanego uruchomienia |
| expired | Stan anulowanego uruchomienia |
runStepDeltaObject
Reprezentuje różnicę kroku uruchamiania, tj. wszelkie zmienione pola w kroku uruchamiania podczas przesyłania strumieniowego.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| delta | obiekt | Delta zawierająca pola, które zostały zmienione w kroku uruchamiania. | Yes | |
| └─ szczegóły kroku | runStepDeltaStepDetailsMessageCreationObject lub runStepDeltaStepDetailsToolCallsObject | Szczegóły kroku uruchamiania. | No | |
| id | ciąg | Identyfikator kroku uruchamiania, do którego można odwoływać się w punktach końcowych interfejsu API. | Yes | |
| obiekt | ciąg | Typ obiektu, który jest zawsze thread.run.step.delta. |
Yes |
object Enum: RunStepDeltaObjectType
| Value | Description |
|---|---|
| thread.run.step.delta |
listRunStepsResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Yes | ||
| first_id | ciąg | Yes | ||
| has_more | boolean | Yes | ||
| last_id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
runStepDetailsMessageCreationObject
Szczegółowe informacje o tworzeniu komunikatu w kroku uruchamiania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| message_creation | obiekt | Yes | ||
| └ message_id | ciąg | Identyfikator komunikatu, który został utworzony przez ten krok przebiegu. | No | |
| typ | ciąg | Zawsze message_creation. |
Yes |
type Enum: Typ obiektu tworzenia wiadomości szczegółów kroku wykonania
| Value | Description |
|---|---|
| message_creation |
runStepDeltaStepDetailsMessageCreationObject
Szczegółowe informacje o tworzeniu komunikatu w kroku uruchamiania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| message_creation | obiekt | No | ||
| └ message_id | ciąg | Identyfikator komunikatu, który został utworzony przez ten krok przebiegu. | No | |
| typ | ciąg | Zawsze message_creation. |
Yes |
typ Enum: RunStepDeltaStepDetailsMessageCreationObjectType
| Value | Description |
|---|---|
| message_creation |
runStepDetailsToolCallsObject
Szczegóły wywołania narzędzia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| tool_calls | macierz | Tablica narzędzi wywołuje krok uruchamiania. Mogą one być skojarzone z jednym z trzech typów narzędzi: code_interpreter, retrieval lub function. |
Yes | |
| typ | ciąg | Zawsze tool_calls. |
Yes |
type Enum: RunStepDetailsToolCallsObjectType
| Value | Description |
|---|---|
| tool_calls |
runStepDeltaStepDetailsToolCallsObject
Szczegóły wywołania narzędzia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| tool_calls | macierz | Tablica narzędzi wywołuje krok uruchamiania. Mogą one być skojarzone z jednym z trzech typów narzędzi: code_interpreter, file_search lub function. |
No | |
| typ | ciąg | Zawsze tool_calls. |
Yes |
type Enum: RunStepDeltaStepDetailsToolCallsObjectType
| Value | Description |
|---|---|
| tool_calls |
runStepDetailsToolCallsCodeObject
Szczegóły narzędzia interpretera kodu, w ramach którego był zaangażowany krok uruchamiania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| code_interpreter | obiekt | Definicja wywołania narzędzia Interpreter kodu. | Yes | |
| └─ Wejście | ciąg | Dane wejściowe wywołania narzędzia Interpreter kodu. | No | |
| Dane wyjściowe └} | macierz | Dane wyjściowe wywołania narzędzia Interpreter kodu. Interpreter kodu może wyświetlać co najmniej jeden element, w tym tekst (logs) lub obrazy (image). Każdy z nich jest reprezentowany przez inny typ obiektu. |
No | |
| id | ciąg | Identyfikator wywołania narzędzia. | Yes | |
| typ | ciąg | Typ wywołania narzędzia. To zawsze będzie code_interpreter dotyczyć tego typu wywołania narzędzia. |
Yes |
type Enum: RunStepDetailsToolCallsCodeObjectType
| Value | Description |
|---|---|
| code_interpreter |
runStepDeltaStepDetailsToolCallsCodeObject
Szczegóły narzędzia interpretera kodu, w ramach którego był zaangażowany krok uruchamiania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| code_interpreter | obiekt | Definicja wywołania narzędzia Interpreter kodu. | No | |
| └─ Wejście | ciąg | Dane wejściowe wywołania narzędzia Interpreter kodu. | No | |
| Dane wyjściowe └} | macierz | Dane wyjściowe wywołania narzędzia Interpreter kodu. Interpreter kodu może wyświetlać co najmniej jeden element, w tym tekst (logs) lub obrazy (image). Każdy z nich jest reprezentowany przez inny typ obiektu. |
No | |
| id | ciąg | Identyfikator wywołania narzędzia. | No | |
| indeks | liczba całkowita | Indeks wywołania narzędzia w narzędziu wywołuje tablicę. | Yes | |
| typ | ciąg | Typ wywołania narzędzia. To zawsze będzie code_interpreter dotyczyć tego typu wywołania narzędzia. |
Yes |
typ wyliczeniowy Enum: RunStepDeltaStepDetailsToolCallsCodeObjectType
| Value | Description |
|---|---|
| code_interpreter |
runStepDetailsToolCallsCodeOutputLogsObject
Dane wyjściowe tekstu z wywołania narzędzia Interpreter kodu w ramach kroku uruchamiania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dzienniki | ciąg | Dane wyjściowe tekstu z wywołania narzędzia Interpreter kodu. | Yes | |
| typ | ciąg | Zawsze logs. |
Yes |
Typ Enum: RunStepDetailsToolCallsCodeOutputLogsObjectType
| Value | Description |
|---|---|
| dzienniki |
runStepDeltaStepDetailsToolCallsCodeOutputLogsObject
Dane wyjściowe tekstu z wywołania narzędzia Interpreter kodu w ramach kroku uruchamiania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| indeks | liczba całkowita | Indeks danych wyjściowych w tablicy danych wyjściowych. | Yes | |
| dzienniki | ciąg | Dane wyjściowe tekstu z wywołania narzędzia Interpreter kodu. | No | |
| typ | ciąg | Zawsze logs. |
Yes |
Step 2: Typ wyliczeniowy: Obiekt typu RunStepDeltaStepDetailsToolCallsCodeOutputLogs
| Value | Description |
|---|---|
| dzienniki |
runStepDetailsToolCallsCodeOutputImageObject
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| obraz | obiekt | Yes | ||
| └ file_id | ciąg | Identyfikator pliku obrazu. | No | |
| typ | ciąg | Zawsze image. |
Yes |
type Enum: RunStepDetailsToolCallsCodeOutputImageObjectType
| Value | Description |
|---|---|
| obraz |
runStepDeltaStepDetailsToolCallsCodeOutputImageObject
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| obraz | obiekt | No | ||
| └ file_id | ciąg | Identyfikator pliku obrazu. | No | |
| indeks | liczba całkowita | Indeks danych wyjściowych w tablicy danych wyjściowych. | Yes | |
| typ | ciąg | Zawsze image. |
Yes |
typ Enum: RunStepDeltaStepDetailsNarzędziaWywołaniaKodWynikowyObiektGraficzny
| Value | Description |
|---|---|
| obraz |
runStepDetailsToolCallsFileSearchObject
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| file_search | obiekt | Na razie zawsze będzie to pusty obiekt. | Yes | |
| Wyniki └} | macierz | Wyniki wyszukiwania plików. | No | |
| id | ciąg | Identyfikator obiektu wywołania narzędzia. | Yes | |
| typ | ciąg | Typ wywołania narzędzia. To zawsze będzie file_search dotyczyć tego typu wywołania narzędzia. |
Yes |
type Enum: RunStepDetailsToolCallsFileSearchObjectType
| Value | Description |
|---|---|
| file_search |
runStepDetailsToolCallsFileSearchResultObject
Wystąpienie wyników wyszukiwania plików.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | macierz | Zawartość znalezionego wyniku. Zawartość jest dołączana tylko w przypadku żądania za pośrednictwem parametru include zapytania. | No | |
| file_id | ciąg | Identyfikator pliku, w ramach którego znaleziono wynik. | Yes | |
| file_name | ciąg | Nazwa pliku, w ramach którego znaleziono wynik. | Yes | |
| wynik | number | Wynik. Wszystkie wartości muszą być liczbą zmiennoprzecinkową z zakresu od 0 do 1. | Yes |
runStepDeltaStepDetailsToolCallsFileSearchObject
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| file_search | obiekt | Na razie zawsze będzie to pusty obiekt. | Yes | |
| id | ciąg | Identyfikator obiektu wywołania narzędzia. | No | |
| indeks | liczba całkowita | Indeks wywołania narzędzia w narzędziu wywołuje tablicę. | Yes | |
| typ | ciąg | Typ wywołania narzędzia. To zawsze będzie retrieval dotyczyć tego typu wywołania narzędzia. |
Yes |
type Enum: RunStepDeltaStepDetailsToolCallsFileSearchObjectType
| Value | Description |
|---|---|
| file_search |
runStepDetailsToolCallsFunctionObject
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| funkcja | obiekt | Definicja funkcji, która została wywołana. | Yes | |
| └─ Argumenty | ciąg | Argumenty przekazane do funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji. | No | |
| └─ Dane wyjściowe | ciąg | Dane wyjściowe funkcji. Będzie to miało wartość null , jeśli dane wyjściowe nie zostały jeszcze przesłane. |
No | |
| id | ciąg | Identyfikator obiektu wywołania narzędzia. | Yes | |
| typ | ciąg | Typ wywołania narzędzia. To zawsze będzie function dotyczyć tego typu wywołania narzędzia. |
Yes |
type Enum: RunStepDetailsToolCallsFunctionObjectType
| Value | Description |
|---|---|
| funkcja |
runStepDeltaStepDetailsToolCallsFunctionObject
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| funkcja | obiekt | Definicja funkcji, która została wywołana. | No | |
| └─ Argumenty | ciąg | Argumenty przekazane do funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji. | No | |
| └─ Dane wyjściowe | ciąg | Dane wyjściowe funkcji. Będzie to miało wartość null , jeśli dane wyjściowe nie zostały jeszcze przesłane. |
No | |
| id | ciąg | Identyfikator obiektu wywołania narzędzia. | No | |
| indeks | liczba całkowita | Indeks wywołania narzędzia w narzędziu wywołuje tablicę. | Yes | |
| typ | ciąg | Typ wywołania narzędzia. To zawsze będzie function dotyczyć tego typu wywołania narzędzia. |
Yes |
type Enum: RunStepDetailsToolCallsFunctionObjectType
| Value | Description |
|---|---|
| funkcja |
vectorStoreExpirationAfter
Zasady wygasania magazynu wektorów.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| kotwica | ciąg | Znacznik czasu zakotwiczenia, po którym mają zastosowanie zasady wygasania. Obsługiwane kotwice: last_active_at. |
Yes | |
| days | liczba całkowita | Liczba dni po upływie czasu zakotwiczenia, przez który magazyn wektorów wygaśnie. | Yes |
anchor Enum: VectorStoreExpirationAfterAnchor
| Value | Description |
|---|---|
| last_active_at | Znacznik czasu zakotwiczenia, po którym mają zastosowanie zasady wygasania. |
vectorStoreObject
Magazyn wektorów to kolekcja przetworzonych plików może być używana przez file_search narzędzie.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| created_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia magazynu wektorów. | Yes | |
| expires_after | vectorStoreExpirationAfter | Zasady wygasania magazynu wektorów. | No | |
| expires_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla czasu wygaśnięcia magazynu wektorów. | No | |
| file_counts | obiekt | Yes | ||
| └* anulowano | liczba całkowita | Liczba anulowanych plików. | No | |
| └─ Ukończono | liczba całkowita | Liczba plików, które zostały pomyślnie przetworzone. | No | |
| └* nie powiodło się | liczba całkowita | Liczba plików, które nie mogły przetworzyć. | No | |
| └─ w_toku | liczba całkowita | Liczba obecnie przetwarzanych plików. | No | |
| └─ suma | liczba całkowita | Całkowita liczba plików. | No | |
| id | ciąg | Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. | Yes | |
| last_active_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla czasu ostatniego aktywnego magazynu wektorów. | Yes | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
Yes | |
| name | ciąg | Nazwa magazynu wektorów. | Yes | |
| obiekt | wyliczenie | Typ obiektu, który jest zawsze vector_store.Możliwe wartości: vector_store |
Yes | |
| stan | ciąg | Stan magazynu wektorów, który może mieć expiredwartość , in_progresslub completed. Stan completed wskazuje, że magazyn wektorów jest gotowy do użycia. |
Yes | |
| usage_bytes | liczba całkowita | Całkowita liczba bajtów używanych przez pliki w magazynie wektorów. | Yes |
status Enum: VectorStoreObjectStatus
| Value | Description |
|---|---|
| expired | |
| in_progress | |
| completed |
createVectorStoreRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunking_strategy | autoChunkingStrategyRequestParam lub staticChunkingStrategyRequestParam | Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. Dotyczy tylko wtedy, gdy file_ids nie jest pusty. |
No | |
| expires_after | vectorStoreExpirationAfter | Zasady wygasania magazynu wektorów. | No | |
| file_ids | macierz | Lista identyfikatorów plików, których powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| name | ciąg | Nazwa magazynu wektorów. | No |
updateVectorStoreRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| expires_after | vectorStoreExpirationAfter | Zasady wygasania magazynu wektorów. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków. |
No | |
| name | ciąg | Nazwa magazynu wektorów. | No |
listVectorStoresResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Yes | ||
| first_id | ciąg | Yes | ||
| has_more | boolean | Yes | ||
| last_id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
deleteVectorStoreResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| deleted | boolean | Yes | ||
| id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
object Enum: DeleteVectorStoreResponseObject
| Value | Description |
|---|---|
| vector_store.deleted | Stan obiektu odpowiedzi magazynu wektorów usuwania |
vectorStoreFileObject
Lista plików dołączonych do magazynu wektorów.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunking_strategy | autoChunkingStrategyRequestParam lub staticChunkingStrategyRequestParam | Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. Dotyczy tylko wtedy, gdy file_ids nie jest pusty. |
No | |
| created_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia pliku magazynu wektorów. | Yes | |
| id | ciąg | Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. | Yes | |
| last_error | obiekt | Ostatni błąd skojarzony z tym plikiem magazynu wektorów. Jeśli nie ma żadnych błędów, będzie występować null błąd. |
Yes | |
| └─ kod | ciąg | Jeden z server_error lub lub invalid_fileunsupported_file . |
No | |
| └─ Komunikat | ciąg | Czytelny dla człowieka opis błędu. | No | |
| obiekt | ciąg | Typ obiektu, który jest zawsze vector_store.file. |
Yes | |
| stan | ciąg | Stan pliku magazynu wektorów, który może mieć in_progresswartość , , completedcancelledlub failed. Stan completed wskazuje, że plik magazynu wektorów jest gotowy do użycia. |
Yes | |
| usage_bytes | liczba całkowita | Łączne użycie magazynu wektorów w bajtach. Należy pamiętać, że może się to różnić od oryginalnego rozmiaru pliku. | Yes | |
| vector_store_id | ciąg | Identyfikator magazynu wektorów, do którego jest dołączony plik. | Yes |
obiekt Enum: VectorStoreFileObjectType
| Value | Description |
|---|---|
| vector_store.file |
Status Enum: VectorStoreFileObjectStatus
| Value | Description |
|---|---|
| in_progress | |
| completed | |
| cancelled | |
| failed |
otherChunkingStrategyResponseParam
Jest to zwracane, gdy strategia fragmentowania jest nieznana. Zazwyczaj jest to spowodowane tym, że plik został zaindeksowany przed wprowadzeniem chunking_strategy koncepcji w interfejsie API.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | ciąg | Zawsze other. |
Yes |
typ Enum: OtherChunkingStrategyResponseParamType
| Value | Description |
|---|---|
| other |
staticChunkingStrategyResponseParam
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| statyczny | staticChunkingStrategy | Yes | ||
| typ | ciąg | Zawsze static. |
Yes |
typ Enum: StaticChunkingStrategyResponseParamType
| Value | Description |
|---|---|
| statyczny |
staticChunkingStrategy
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunk_overlap_tokens | liczba całkowita | Liczba tokenów nakładających się między fragmentami. Wartość domyślna to 400.Należy pamiętać, że nakładanie się nie może przekraczać połowy wartości max_chunk_size_tokens. |
Yes | |
| max_chunk_size_tokens | liczba całkowita | Maksymalna liczba tokenów w każdym kawałku. Wartość domyślna to 800. Wartość minimalna to 100 , a wartość maksymalna to 4096. |
Yes |
autoChunkingStrategyRequestParam
Strategia domyślna. Ta strategia używa obecnie wartości max_chunk_size_tokens800 i chunk_overlap_tokens .400
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Zawsze auto.Możliwe wartości: auto |
Yes |
staticChunkingStrategyRequestParam
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| statyczny | staticChunkingStrategy | Yes | ||
| typ | wyliczenie | Zawsze static.Możliwe wartości: static |
Yes |
chunkingStrategyRequestParam
Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii.
Ten składnik może być jednym z następujących elementów:
createVectorStoreFileRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunking_strategy | chunkingStrategyRequestParam | Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. |
No | |
| file_id | ciąg | Identyfikator pliku, którego powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. |
Yes |
listVectorStoreFilesResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Yes | ||
| first_id | ciąg | Yes | ||
| has_more | boolean | Yes | ||
| last_id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
deleteVectorStoreFileResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| deleted | boolean | Yes | ||
| id | ciąg | Yes | ||
| obiekt | ciąg | Yes |
object Enum: DeleteVectorStoreFileResponseObject
| Value | Description |
|---|---|
| vector_store.file.deleted |
vectorStoreFileBatchObject
Partia plików dołączonych do magazynu wektorów.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| created_at | liczba całkowita | Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia partii plików magazynu wektorów. | Yes | |
| file_counts | obiekt | Yes | ||
| └* anulowano | liczba całkowita | Liczba anulowanych plików. | No | |
| └─ Ukończono | liczba całkowita | Liczba przetworzonych plików. | No | |
| └* nie powiodło się | liczba całkowita | Liczba plików, które nie mogły przetworzyć. | No | |
| └─ w_toku | liczba całkowita | Liczba obecnie przetwarzanych plików. | No | |
| └─ suma | liczba całkowita | Całkowita liczba plików. | No | |
| id | ciąg | Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. | Yes | |
| obiekt | ciąg | Typ obiektu, który jest zawsze vector_store.file_batch. |
Yes | |
| stan | ciąg | Stan partii plików magazynu wektorów, który może mieć in_progresswartość , completedcancelled lub failed. |
Yes | |
| vector_store_id | ciąg | Identyfikator magazynu wektorów, do którego jest dołączony plik. | Yes |
obiekt Enum: VectorStoreFileBatchObjectType
| Value | Description |
|---|---|
| vector_store.files_batch |
status Enum: VectorStoreFileBatchObjectStatus
| Value | Description |
|---|---|
| in_progress | |
| completed | |
| cancelled | |
| failed |
createVectorStoreFileBatchRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| chunking_strategy | chunkingStrategyRequestParam | Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. |
No | |
| file_ids | macierz | Lista identyfikatorów plików, których powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. |
Yes |
assistantStreamEvent
Reprezentuje zdarzenie emitowane podczas przesyłania strumieniowego przebiegu.
Każde zdarzenie w strumieniu zdarzeń wysyłanych przez serwer ma event właściwość i :data
event: thread.created
data: {"id": "thread_123", "object": "thread", ...}
Emitujemy zdarzenia za każdym razem, gdy tworzony jest nowy obiekt, przechodzi do nowego stanu lub jest przesyłany strumieniowo w częściach (różnice). Na przykład emitujemy thread.run.created po utworzeniu nowego przebiegu, thread.run.completed po zakończeniu przebiegu itd. Gdy Asystent zdecyduje się utworzyć komunikat podczas przebiegu, emitujemy thread.message.created eventzdarzenie , thread.message.in_progress wiele thread.message.delta zdarzeń i na thread.message.completed koniec zdarzenie.
Możemy dodać dodatkowe zdarzenia w czasie, dlatego zalecamy bezproblemowe obsługę nieznanych zdarzeń w kodzie.
Ten składnik może być jednym z następujących elementów:
threadStreamEvent
Ten składnik może być jednym z następujących elementów:
thread.created
Występuje po utworzeniu nowego wątku.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | threadObject | Reprezentuje wątek zawierający komunikaty. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: threadObject
Wyliczenie zdarzeń: ThreadStreamEventEnum
| Value | Description |
|---|---|
| thread.created | Zdarzenie utworzone przez wątek |
runStreamEvent
Ten składnik może być jednym z następujących elementów:
thread.run.created
Występuje po utworzeniu nowego przebiegu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runObject | Reprezentuje przebieg wykonywania w wątkach. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventCreated
| Value | Description |
|---|---|
| thread.run.created |
thread.run.queued
Występuje, gdy przebieg przechodzi do queued stanu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runObject | Reprezentuje przebieg wykonywania w wątkach. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventQueued
| Value | Description |
|---|---|
| thread.run.queued |
thread.run.in_progress
Występuje, gdy przebieg przechodzi do in_progress stanu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runObject | Reprezentuje przebieg wykonywania w wątkach. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventInProgress
| Value | Description |
|---|---|
| thread.run.in_progress |
thread.run.requires_action
Występuje, gdy przebieg przechodzi do requires_action stanu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runObject | Reprezentuje przebieg wykonywania w wątkach. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventRequiresAction
| Value | Description |
|---|---|
| thread.run.requires_action |
thread.run.completed
Występuje po zakończeniu przebiegu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runObject | Reprezentuje przebieg wykonywania w wątkach. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventCompleted
| Value | Description |
|---|---|
| thread.run.completed |
thread.run.failed
Występuje, gdy uruchomienie zakończy się niepowodzeniem.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runObject | Reprezentuje przebieg wykonywania w wątkach. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventFailed
| Value | Description |
|---|---|
| thread.run.failed |
thread.run.cancelling
Występuje, gdy przebieg przechodzi do cancelling stanu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runObject | Reprezentuje przebieg wykonywania w wątkach. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventCancelling
| Value | Description |
|---|---|
| thread.run.cancelling |
thread.run.cancelled
Występuje po anulowaniu przebiegu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runObject | Reprezentuje przebieg wykonywania w wątkach. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventCancelled
| Value | Description |
|---|---|
| thread.run.cancelled |
thread.run.expired
Występuje po wygaśnięciu przebiegu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runObject | Reprezentuje przebieg wykonywania w wątkach. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventExpired
| Value | Description |
|---|---|
| thread.run.expired |
runStepStreamEvent
Ten składnik może być jednym z następujących elementów:
thread.run.step.created
Występuje po utworzeniu kroku uruchamiania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runStepObject | Reprezentuje krok wykonywania przebiegu. |
Yes | |
| wydarzenie | ciąg | Yes |
Dane: runStepObject
Wyliczenie zdarzeń: RunStepStreamEventCreated
| Value | Description |
|---|---|
| thread.run.step.created |
thread.run.step.in_progress
Występuje, gdy krok uruchomienia przechodzi do in_progress stanu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runStepObject | Reprezentuje krok wykonywania przebiegu. |
Yes | |
| wydarzenie | ciąg | Yes |
Dane: runStepObject
Wyliczenie zdarzeń: RunStepStreamEventInProgress
| Value | Description |
|---|---|
| thread.run.step.in_progress |
thread.run.step.delta
Występuje, gdy są przesyłane strumieniowo części kroku uruchamiania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runStepDeltaObject | Reprezentuje różnicę kroku uruchamiania, tj. wszelkie zmienione pola w kroku uruchamiania podczas przesyłania strumieniowego. |
Yes | |
| wydarzenie | ciąg | Yes |
Dane: runStepDeltaObject
Wyliczenie zdarzeń: RunStepStreamEventDelta
| Value | Description |
|---|---|
| thread.run.step.delta |
thread.run.step.completed
Występuje po zakończeniu kroku uruchamiania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runStepObject | Reprezentuje krok wykonywania przebiegu. |
Yes | |
| wydarzenie | ciąg | Yes |
Dane: runStepObject
Wyliczenie zdarzeń: RunStepStreamEventCompleted
| Value | Description |
|---|---|
| thread.run.step.completed |
thread.run.step.failed
Występuje, gdy krok uruchomienia zakończy się niepowodzeniem.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runStepObject | Reprezentuje krok wykonywania przebiegu. |
Yes | |
| wydarzenie | ciąg | Yes |
Dane: runStepObject
Wyliczenie zdarzenia: RunStepStreamEventFailed
| Value | Description |
|---|---|
| thread.run.step.failed |
thread.run.step.cancelled
Występuje, gdy krok uruchomienia zostanie anulowany.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runStepObject | Reprezentuje krok wykonywania przebiegu. |
Yes | |
| wydarzenie | ciąg | Yes |
Dane: runStepObject
Wyliczenie zdarzeń: RunStepStreamEventCancelled
| Value | Description |
|---|---|
| thread.run.step.cancelled |
thread.run.step.expired
Występuje, gdy krok uruchomienia wygaśnie.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | runStepObject | Reprezentuje krok wykonywania przebiegu. |
Yes | |
| wydarzenie | ciąg | Yes |
Dane: runStepObject
Wyliczenie zdarzeń: RunStepStreamEventExpired
| Value | Description |
|---|---|
| thread.run.step.expired |
messageStreamEvent
Ten składnik może być jednym z następujących elementów:
thread.message.created
Występuje po utworzeniu komunikatu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | messageObject | Reprezentuje wiadomość w ramach wątków. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: messageObject
Wyliczenie zdarzeń: MessageStreamEventCreated
| Value | Description |
|---|---|
| thread.message.created |
thread.message.in_progress
Występuje, gdy komunikat przechodzi do in_progress stanu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | messageObject | Reprezentuje wiadomość w ramach wątków. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: messageObject
Wyliczenie zdarzeń: MessageStreamEventInProgress
| Value | Description |
|---|---|
| thread.message.in_progress |
thread.message.delta
Występuje, gdy są przesyłane strumieniowo części komunikatu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | messageDeltaObject | Reprezentuje różnicę komunikatów, tj. wszystkie zmienione pola w wiadomości podczas przesyłania strumieniowego. |
Yes | |
| wydarzenie | ciąg | Yes |
Dane: messageDeltaObject
Wyliczenie zdarzeń: MessageStreamEventDelta
| Value | Description |
|---|---|
| thread.message.delta |
thread.message.completed
Występuje po zakończeniu komunikatu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | messageObject | Reprezentuje wiadomość w ramach wątków. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: messageObject
Wyliczenie zdarzeń: MessageStreamEventCompleted
| Value | Description |
|---|---|
| thread.message.completed |
thread.message.incomplete
Występuje, gdy komunikat kończy się przed jego ukończeniem.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | messageObject | Reprezentuje wiadomość w ramach wątków. | Yes | |
| wydarzenie | ciąg | Yes |
Dane: messageObject
Wyliczenie zdarzeń: MessageStreamEventIncomplete
| Value | Description |
|---|---|
| thread.message.incomplete |
Annotation
Ten składnik może być jednym z następujących elementów:
Click
Akcja kliknięcia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| button | wyliczenie | Wskazuje, który przycisk myszy został naciśnięty podczas kliknięcia.
leftJeden z , right, wheel, back, lub forward.Możliwe wartości: left, , rightwheel, , backforward |
Yes | |
| typ | wyliczenie | Określa typ zdarzenia. W przypadku akcji kliknięcia ta właściwość jest zawsze ustawiona na click.Możliwe wartości: click |
Yes | |
| x | liczba całkowita | Współrzędna x, w której wystąpiło kliknięcie. |
Yes | |
| y | liczba całkowita | Współrzędna y, w której wystąpiło kliknięcie. |
Yes |
CodeInterpreterFileOutput
Dane wyjściowe wywołania narzędzia interpretera kodu, które jest plikiem.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| files | macierz | Yes | ||
| typ | wyliczenie | Typ danych wyjściowych pliku interpretera kodu. Zawsze files.Możliwe wartości: files |
Yes |
CodeInterpreterTextOutput
Dane wyjściowe wywołania narzędzia interpretera kodu, które jest tekstem.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dzienniki | ciąg | Dzienniki wywołania narzędzia interpretera kodu. |
Yes | |
| typ | wyliczenie | Typ danych wyjściowych tekstu interpretera kodu. Zawsze logs.Możliwe wartości: logs |
Yes |
CodeInterpreterTool
Narzędzie, które uruchamia kod.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| file_ids | macierz | Identyfikatory plików do uruchomienia kodu. |
Yes | |
| typ | wyliczenie | Typ narzędzia interpretera kodu. Zawsze code_interpreter.Możliwe wartości: code_interpreter |
Yes |
CodeInterpreterToolCall
Wywołanie narzędzia w celu uruchomienia kodu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| kod | ciąg | Kod do uruchomienia. |
Yes | |
| id | ciąg | Unikatowy identyfikator wywołania narzędzia interpretera kodu. |
Yes | |
| results | macierz | Wyniki wywołania narzędzia interpretera kodu. |
Yes | |
| stan | wyliczenie | Stan wywołania narzędzia interpretera kodu. Możliwe wartości: in_progress, , interpretingcompleted |
Yes | |
| typ | wyliczenie | Typ wywołania narzędzia interpretera kodu. Zawsze code_interpreter_call.Możliwe wartości: code_interpreter_call |
Yes |
CodeInterpreterToolOutput
Ten składnik może być jednym z następujących elementów:
ComparisonFilter
Filtr używany do porównywania określonego klucza atrybutu z daną wartością przy użyciu zdefiniowanej operacji porównania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| klucz | ciąg | Klucz do porównania z wartością. | Yes | |
| typ | wyliczenie | Określa operator porównania: eq, , ne, gtgte, lt, . lte- eq:Equals- ne: nie równa się- gt: większe niż- gte: większe niż lub równe- lt: mniejsze niż- lte: mniejsze niż lub równeMożliwe wartości: eq, , negt, gte, , ltlte |
Yes | |
| value | ciąg lub liczba lub wartość logiczna | Wartość do porównania z kluczem atrybutu; obsługuje typy ciągów, liczb lub wartości logicznych. | Yes |
CompoundFilter
Połącz wiele filtrów przy użyciu polecenia and lub or.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| filters | macierz | Tablica filtrów do połączenia. Elementy mogą mieć wartość ComparisonFilter lub CompoundFilter. |
Yes | |
| typ | wyliczenie | Typ operacji: and lub or.Możliwe wartości: and, or |
Yes |
ComputerAction
Ten składnik może być jednym z następujących elementów:
ComputerScreenshotImage
Obraz zrzutu ekranu komputera używany w narzędziu do obsługi komputera.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| file_id | ciąg | Identyfikator przekazanego pliku zawierającego zrzut ekranu. | No | |
| image_url | ciąg | Adres URL obrazu zrzutu ekranu. | No | |
| typ | wyliczenie | Określa typ zdarzenia. W przypadku zrzutu ekranu komputera ta właściwość jest zawsze ustawiona na computer_screenshot.Możliwe wartości: computer_screenshot |
Yes |
ComputerTool
Narzędzie kontrolujące komputer wirtualny.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| display_height | number | Wysokość wyświetlacza komputera. |
Yes | |
| display_width | number | Szerokość ekranu komputera. |
Yes | |
| środowisko | wyliczenie | Typ środowiska komputera do sterowania. Możliwe wartości: mac, , windows, ubuntubrowser |
Yes | |
| typ | wyliczenie | Typ narzędzia do użycia komputera. Zawsze computer_use_preview.Możliwe wartości: computer-use-preview |
Yes |
ComputerToolCall
Narzędzie wywołujące narzędzie do korzystania z komputera.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| akcja | ComputerAction | Yes | ||
| call_id | ciąg | Identyfikator używany podczas odpowiadania na wywołanie narzędzia z danymi wyjściowymi. |
Yes | |
| id | ciąg | Unikatowy identyfikator wywołania komputera. | Yes | |
| pending_safety_checks | macierz | Oczekujące kontrole bezpieczeństwa dla wywołania komputera. |
Yes | |
| stan | wyliczenie | Stan elementu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
Yes | |
| typ | wyliczenie | Typ wywołania komputera. Zawsze computer_call.Możliwe wartości: computer_call |
Yes |
ComputerToolCallOutput
Dane wyjściowe z wywołania narzędzia komputerowego.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| acknowledged_safety_checks | macierz | Kontrole bezpieczeństwa, które zostały zgłoszone przez interfejs API i potwierdzone przez dewelopera. |
No | |
| call_id | ciąg | Identyfikator wywołania narzędzia komputerowego, które wygenerowało dane wyjściowe. |
Yes | |
| id | ciąg | Identyfikator wyniku wywołania komputerowego narzędzia. |
No | |
| We/Wy | ComputerScreenshotImage | Obraz zrzutu ekranu komputera używany w narzędziu do obsługi komputera. |
Yes | |
| stan | wyliczenie | Stan danych wejściowych komunikatu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy wejściowe są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
No | |
| typ | wyliczenie | Typ danych wyjściowych wywołania narzędzia komputerowego. Zawsze computer_call_output.Możliwe wartości: computer_call_output |
Yes |
ComputerToolCallOutputResource
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| acknowledged_safety_checks | macierz | Kontrole bezpieczeństwa, które zostały zgłoszone przez interfejs API i potwierdzone przez dewelopera. |
No | |
| call_id | ciąg | Identyfikator wywołania narzędzia komputerowego, które wygenerowało dane wyjściowe. |
Yes | |
| id | ciąg | Unikatowy identyfikator danych wyjściowych narzędzia do wywołań komputerowych. |
Yes | |
| We/Wy | ComputerScreenshotImage | Obraz zrzutu ekranu komputera używany w narzędziu do obsługi komputera. |
Yes | |
| stan | wyliczenie | Stan danych wejściowych komunikatu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy wejściowe są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
No | |
| typ | wyliczenie | Typ danych wyjściowych wywołania narzędzia komputerowego. Zawsze computer_call_output.Możliwe wartości: computer_call_output |
Yes |
ComputerToolCallSafetyCheck
Zaplanowana kontrola bezpieczeństwa dla komputerowego wezwania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| kod | ciąg | Typ oczekującego sprawdzenia bezpieczeństwa. | Yes | |
| id | ciąg | Identyfikator oczekującego sprawdzenia bezpieczeństwa. | Yes | |
| komunikat | ciąg | Szczegółowe informacje na temat nadchodzących kontroli bezpieczeństwa. | Yes |
Content
Zawartość danych wejściowych i wyjściowych wielomodalnych.
Ten składnik może być jednym z następujących elementów:
Coordinate
Para współrzędnych x/y, np. { x: 100, y: 200 }.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| x | liczba całkowita | Współrzędna x. |
Yes | |
| y | liczba całkowita | Współrzędna y. |
Yes |
CreateModelResponseProperties
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| metadane | Metadata | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków. |
No | |
| model | ciąg | Model używany do generowania odpowiedzi. | No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie. |
No | 1 |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie. |
No | 1 |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc usłudze OpenAI w monitorowaniu i wykrywaniu nadużyć. . |
No |
createResponse
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| include | macierz | {"$ref": "#/components/schemas/includable/description"} | No | |
| dane wejściowe | ciąg lub tablica | Dane wejściowe tekstu, obrazu lub pliku w modelu używane do generowania odpowiedzi. | Yes | |
| instructions | ciąg | Wstawia komunikat systemu (lub dewelopera) jako pierwszy element w kontekście modelu. Podczas używania previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia proste wymienianie komunikatów systemowych lub komunikatów od deweloperów w nowych odpowiedziach. |
No | |
| max_output_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widoczne tokeny wyjściowe i tokeny rozumowania. |
No | |
| parallel_tool_calls | boolean | Czy zezwolić modelowi na równoległe uruchamianie wywołań narzędzi. |
No | True |
| previous_response_id | ciąg | Unikatowy identyfikator poprzedniej odpowiedzi na model. Użyj tego, aby utworzyć wielokrotne konwersacje. | No | |
| reasoning | Reasoning | Opcje konfiguracji dla modeli rozumowania. | No | |
| przechowywać | boolean | Określa, czy przechowywać wygenerowaną odpowiedź modelu na potrzeby późniejszego pobierania za pośrednictwem interfejsu API. |
No | True |
| odtwarzać strumieniowo | boolean | W przypadku ustawienia wartości true dane odpowiedzi modelu będą przesyłane strumieniowo do klienta, ponieważ są generowane przy użyciu zdarzeń wysyłanych przez serwer. | No | False |
| SMS | obiekt | Opcje konfiguracji generowania odpowiedzi tekstowej przez model. Może to być zwykły tekst lub dane JSON ze strukturą. Więcej informacji: - wprowadzanie tekstu i dane wyjściowe - Ustrukturyzowane wyniki |
No | |
| Format └─ | TextResponseFormatConfiguration | Obiekt określający format, który musi zostać wygenerowany przez model. Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, co zapewnia, że model jest zgodny ze podanym schematem JSON. Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.Niezalecane w przypadku modeli gpt-4o i nowszych: Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują. |
No | |
| tool_choice | ToolChoiceOptions lub ToolChoiceTypes lub ToolChoiceFunction | W jaki sposób model powinien wybrać narzędzie (lub narzędzia), które ma być używane podczas generowania odpowiedzi. Zobacz parametr , tools aby zobaczyć, jak określić narzędzia, które może wywołać model. |
No | |
| tools | macierz | Tablica narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając tool_choice parametr .Dwie kategorie narzędzi, które można modelowi podać, to: - Wbudowane narzędzia |
No | |
| truncation | wyliczenie | Strategia obcinania, która ma być użyta dla odpowiedzi modelu. - auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstu modelu, model zostanie obcięty odpowiedź mająca na celu dostosowanie się do okna kontekstu poprzez pominięcie elementów wejściowych w środku rozmowy. - disabled (ustawienie domyślne): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstu dla modelu, żądanie zakończy się niepowodzeniem z powodu błędu 400.Możliwe wartości: auto, disabled |
No |
DoubleClick
Dwukrotne kliknięcie myszy.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Określa typ zdarzenia. W przypadku akcji dwukrotnego kliknięcia ta właściwość jest zawsze ustawiana jako double_click.Możliwe wartości: double_click |
Yes | |
| x | liczba całkowita | Współrzędna x, w której wystąpiło dwukrotne kliknięcie. |
Yes | |
| y | liczba całkowita | Współrzędna y, w której wystąpiło dwukrotne kliknięcie. |
Yes |
Drag
Czynność przeciągania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| ścieżka | macierz | Tablica współrzędnych reprezentujących ścieżkę operacji przeciągania. Współrzędne będą wyświetlane jako tablica obiektów, np.[{ x: 100, y: 200 }, { x: 200, y: 300 }] |
Yes | |
| typ | wyliczenie | Określa typ zdarzenia. W przypadku akcji przeciągania ta właściwość jest zawsze ustawiana na drag.Możliwe wartości: drag |
Yes |
EasyInputMessage
Wiadomość jako wejście do modelu z rolą wskazującą przestrzeganie hierarchii instrukcji. Instrukcje przypisane do roli developer lub system mają pierwszeństwo przed instrukcjami przypisanymi do roli user. Przyjmuje się, że komunikaty z rolą assistant zostały wygenerowane przez model w poprzednich interakcjach.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | string lub InputMessageContentList | Tekst, obraz lub dane wejściowe audio w modelu używane do generowania odpowiedzi. Może również zawierać poprzednie odpowiedzi asystenta. |
Yes | |
| rola | wyliczenie | Rola wejścia komunikatu.
userJeden z , assistant, systemlub developer.Możliwe wartości: user, , assistant, systemdeveloper |
Yes | |
| typ | wyliczenie | Typ danych wejściowych komunikatu. Zawsze message.Możliwe wartości: message |
No |
FileCitation
Cytat do pliku.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| file_id | ciąg | Identyfikator pliku. |
Yes | |
| indeks | liczba całkowita | Indeks pliku na liście plików. |
Yes | |
| typ | wyliczenie | Typ cytowania pliku. Zawsze file_citation.Możliwe wartości: file_citation |
Yes |
FilePath
Ścieżka do pliku.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| file_id | ciąg | Identyfikator pliku. |
Yes | |
| indeks | liczba całkowita | Indeks pliku na liście plików. |
Yes | |
| typ | wyliczenie | Typ ścieżki pliku. Zawsze file_path.Możliwe wartości: file_path |
Yes |
FileSearchRanker
Klasyfikator używany do wyszukiwania plików. Jeśli nie zostanie określony, system użyje klasyfikatora auto.
| Property | Value |
|---|---|
| Description | Klasyfikator używany do wyszukiwania plików. Jeśli nie zostanie określony, system użyje klasyfikatora auto. |
| Type | ciąg |
| Values | autodefault_2024_08_21 |
FileSearchTool
Narzędzie wyszukujące odpowiednią zawartość z przekazanych plików.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| filters | Filtr porównawczy lub filtr złożony | Filtr do zastosowania na podstawie atrybutów pliku. | No | |
| max_num_results | liczba całkowita | Maksymalna liczba wyników do zwrócenia. Ta liczba powinna należeć do zakresu od 1 do 50 włącznie. |
No | |
| ranking_options | obiekt | Opcje klasyfikacji wyszukiwania. | No | |
| └} ranker | wyliczenie | Klasyfikator używany do wyszukiwania plików. Możliwe wartości: auto, default-2024-11-15 |
No | |
| └─ próg_punktowy | number | Próg oceny dla wyszukiwania plików, liczba z zakresu od 0 do 1. Liczby bliżej 1 będą próbować zwracać tylko najbardziej odpowiednie wyniki, ale mogą zwracać mniej wyników. |
No | 0 |
| typ | wyliczenie | Typ narzędzia wyszukiwania plików. Zawsze file_search.Możliwe wartości: file_search |
Yes | |
| vector_store_ids | macierz | Identyfikatory wektorów są przechowywane do wyszukiwania. |
Yes |
FileSearchToolCall
Wyniki wywołania narzędzia wyszukiwania plików.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| id | ciąg | Unikatowy identyfikator wywołania narzędzia wyszukiwania plików. |
Yes | |
| queries | macierz | Zapytania używane do wyszukiwania plików. |
Yes | |
| results | macierz | Wyniki wywołania narzędzia wyszukiwania plików. |
No | |
| stan | wyliczenie | Stan wywołania narzędzia do wyszukiwania plików.
in_progressJeden z , searchinglub incompletefailed,Możliwe wartości: in_progress, , searchingcompleted, , incompletefailed |
Yes | |
| typ | wyliczenie | Typ wywołania narzędzia wyszukiwania plików. Zawsze file_search_call.Możliwe wartości: file_search_call |
Yes |
FunctionTool
Definiuje funkcję w swoim kodzie, którą model może wywołać.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| description | ciąg | Opis funkcji. Używany przez model do określania, czy wywołać funkcję. |
No | |
| name | ciąg | Nazwa funkcji do wywołania. |
Yes | |
| parameters | obiekt | Obiekt schematu JSON opisujący parametry funkcji. |
Yes | |
| strict | boolean | Czy wymusić ścisłą walidację parametrów. Wartość domyślna true. |
Yes | |
| typ | wyliczenie | Typ narzędzia funkcji. Zawsze function.Możliwe wartości: function |
Yes |
FunctionToolCall
Wywołanie narzędzia w celu uruchomienia funkcji.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| arguments | ciąg | Łańcuch JSON zawierający argumenty do przekazania do funkcji. |
Yes | |
| call_id | ciąg | Unikalny identyfikator wywołania funkcji narzędzia wygenerowany przez model. |
Yes | |
| id | ciąg | Unikatowy identyfikator wywołania narzędzia funkcjonalnego. |
Yes | |
| name | ciąg | Nazwa funkcji do uruchomienia. |
Yes | |
| stan | wyliczenie | Stan elementu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
No | |
| typ | wyliczenie | Typ wywołania funkcji narzędziowej. Zawsze function_call.Możliwe wartości: function_call |
Yes |
FunctionToolCallOutput
Dane wyjściowe wywołania narzędzia funkcji.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| call_id | ciąg | Unikalny identyfikator wywołania funkcji narzędzia wygenerowany przez model. |
Yes | |
| id | ciąg | Unikatowy identyfikator danych wyjściowych wywołania narzędzia funkcji. Wypełniane, gdy ten element jest zwracany za pośrednictwem interfejsu API. |
No | |
| We/Wy | ciąg | Ciąg JSON zawierający dane wyjściowe z wywołania narzędzia funkcji. |
Yes | |
| stan | wyliczenie | Stan elementu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
No | |
| typ | wyliczenie | Typ danych wyjściowych wywołania narzędzia funkcji. Zawsze function_call_output.Możliwe wartości: function_call_output |
Yes |
FunctionToolCallOutputResource
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| call_id | ciąg | Unikalny identyfikator wywołania funkcji narzędzia wygenerowany przez model. |
Yes | |
| id | ciąg | Unikatowy identyfikator danych wyjściowych narzędzia wywołania funkcji. |
Yes | |
| We/Wy | ciąg | Ciąg JSON zawierający dane wyjściowe z wywołania narzędzia funkcji. |
Yes | |
| stan | wyliczenie | Stan elementu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
No | |
| typ | wyliczenie | Typ danych wyjściowych wywołania narzędzia funkcji. Zawsze function_call_output.Możliwe wartości: function_call_output |
Yes |
includable
Określ dodatkowe dane wyjściowe do uwzględnienia w odpowiedzi modelu. Obecnie obsługiwane wartości to:
-
file_search_call.results: uwzględnij wyniki operacji narzędzia do wyszukiwania plików. -
message.input_image.image_url: dołącz adresy URL obrazów z komunikatu wejściowego. -
computer_call_output.output.image_url: dołącz adresy URL obrazów z wyniku wywołania komputera.
| Property | Value |
|---|---|
| Description | Określ dodatkowe dane wyjściowe do uwzględnienia w odpowiedzi modelu. Obecnie obsługiwane wartości to: - file_search_call.results: Dołącz wyniki wyszukiwania uzyskane z wezwania narzędzia do wyszukiwania plików.- message.input_image.image_url: dołącz adresy URL obrazów z komunikatu wejściowego.- computer_call_output.output.image_url: dołącz adresy URL obrazów z wyników procesu komputerowego. |
| Type | ciąg |
| Values | file_search_call.resultsmessage.input_image.image_urlcomputer_call_output.output.image_url |
InputAudio
Dane audio jako wejście do modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | ciąg | Dane audio zakodowane w formacie Base64. |
Yes | |
| format | wyliczenie | Format danych audio. Obecnie obsługiwane formaty to mp3 i wav.Możliwe wartości: mp3, wav |
Yes | |
| typ | wyliczenie | Typ elementu wejściowego. Zawsze input_audio.Możliwe wartości: input_audio |
Yes |
InputContent
Ten składnik może być jednym z następujących elementów:
InputFile
Plik wejściowy do modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| file_data | ciąg | Zawartość pliku, który ma zostać wysłany do modelu. |
No | |
| file_id | ciąg | Identyfikator pliku, który ma zostać wysłany do modelu. |
No | |
| filename | ciąg | Nazwa pliku, który ma zostać wysłany do modelu. |
No | |
| typ | wyliczenie | Typ elementu wejściowego. Zawsze input_file.Możliwe wartości: input_file |
Yes |
InputImage
Dane wejściowe obrazu do modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| detail | wyliczenie | Poziom szczegółowości obrazu, który ma zostać wysłany do modelu.
highJeden z , lowlub auto. Wartość domyślna to auto.Możliwe wartości: high, , lowauto |
Yes | |
| file_id | ciąg | Identyfikator pliku, który ma zostać wysłany do modelu. |
No | |
| image_url | ciąg | Adres URL obrazu, który ma zostać wysłany do modelu. W pełni kwalifikowany adres URL lub obraz zakodowany w formacie base64 w adresie URL danych. |
No | |
| typ | wyliczenie | Typ elementu wejściowego. Zawsze input_image.Możliwe wartości: input_image |
Yes |
InputItem
Ten składnik może być jednym z następujących elementów:
InputMessage
Wiadomość jako wejście do modelu z rolą wskazującą przestrzeganie hierarchii instrukcji. Instrukcje przypisane do roli developer lub system mają pierwszeństwo przed instrukcjami przypisanymi do roli user.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | InputMessageContentList | Lista jednego lub wielu elementów wejściowych do modelu zawierająca inną zawartość types. |
Yes | |
| rola | wyliczenie | Rola wejścia komunikatu.
userJeden z , systemlub developer.Możliwe wartości: user, , systemdeveloper |
Yes | |
| stan | wyliczenie | Stan elementu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
No | |
| typ | wyliczenie | Typ danych wejściowych komunikatu. Zawsze ustaw na message.Możliwe wartości: message |
No |
InputMessageContentList
Lista jednego lub wielu elementów wejściowych do modelu zawierająca różne typy zawartości.
Brak zdefiniowanych właściwości dla tego składnika.
InputMessageResource
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | InputMessageContentList | Lista jednego lub wielu elementów wejściowych do modelu zawierająca inną zawartość types. |
Yes | |
| id | ciąg | Unikatowy identyfikator wejściowy wiadomości. |
Yes | |
| rola | wyliczenie | Rola wejścia komunikatu.
userJeden z , systemlub developer.Możliwe wartości: user, , systemdeveloper |
Yes | |
| stan | wyliczenie | Stan elementu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
No | |
| typ | wyliczenie | Typ danych wejściowych komunikatu. Zawsze ustaw na message.Możliwe wartości: message |
No |
InputText
Wprowadzanie tekstu do modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| SMS | ciąg | Wprowadzanie tekstu do modelu. |
Yes | |
| typ | wyliczenie | Typ elementu wejściowego. Zawsze input_text.Możliwe wartości: input_text |
Yes |
Item
Element zawartości używany do generowania odpowiedzi.
Ten składnik może być jednym z następujących elementów:
- InputMessage
- OutputMessage
- FileSearchToolCall
- ComputerToolCall
- ComputerToolCallOutput
- FunctionToolCall
- FunctionToolCallOutput
- ReasoningItem
ItemReference
Wewnętrzny identyfikator elementu do celów odniesienia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| id | ciąg | Identyfikator elementu referencyjnego. |
Yes | |
| typ | wyliczenie | Typ elementu referencyjnego. Zawsze item_reference.Możliwe wartości: item_reference |
Yes |
ItemResource
Element zawartości używany do generowania odpowiedzi.
Ten składnik może być jednym z następujących elementów:
- InputMessageResource
- OutputMessage
- FileSearchToolCall
- ComputerToolCall
- ComputerToolCallOutputResource
- FunctionToolCall
- FunctionToolCallOutputResource
KeyPress
Kolekcja naciśnięć klawiszy, które model chciałby wykonać.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| keys | macierz | Kombinacja klawiszy, którą model żąda naciśnięcia. Jest to tablica ciągów, z których każdy reprezentuje klucz. |
Yes | |
| typ | wyliczenie | Określa typ zdarzenia. W przypadku akcji keypress ta właściwość jest zawsze ustawiona na wartość keypress.Możliwe wartości: keypress |
Yes |
Metadata
Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego.
Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków.
Brak zdefiniowanych właściwości dla tego składnika.
ModelResponseProperties
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| metadane | Metadata | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków. |
No | |
| model | ciąg | Model używany do generowania odpowiedzi. | No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie. |
No | 1 |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie. |
No | 1 |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc usłudze OpenAI w monitorowaniu i wykrywaniu nadużyć. . |
No |
Move
Akcja ruchu myszy.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Określa typ zdarzenia. W przypadku akcji przenoszenia ta właściwość jest zawsze ustawiona na move.Możliwe wartości: move |
Yes | |
| x | liczba całkowita | Współrzędna x, do której należy się przesunąć. |
Yes | |
| y | liczba całkowita | Współrzędna y, do której należy się przesunąć. |
Yes |
OutputAudio
Sygnał wyjściowy audio z modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | ciąg | Dane audio zakodowane w formacie Base64 z modelu. |
Yes | |
| transkrypcja | ciąg | Transkrypcja danych audio z modelu. |
Yes | |
| typ | wyliczenie | Typ dźwięku wyjściowego. Zawsze output_audio.Możliwe wartości: output_audio |
Yes |
OutputContent
Ten składnik może być jednym z następujących elementów:
OutputItem
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| akcja | ComputerAction | Yes | ||
| arguments | ciąg | Łańcuch JSON zawierający argumenty do przekazania do funkcji. |
Yes | |
| call_id | ciąg | Identyfikator używany podczas odpowiadania na wywołanie narzędzia z danymi wyjściowymi. |
Yes | |
| zawartość | macierz | Analiza zawartości tekstu. |
Yes | |
| id | ciąg | Unikatowy identyfikator zawartości rozumowania. |
Yes | |
| name | ciąg | Nazwa funkcji do uruchomienia. |
Yes | |
| pending_safety_checks | macierz | Oczekujące kontrole bezpieczeństwa dla wywołania komputera. |
Yes | |
| queries | macierz | Zapytania używane do wyszukiwania plików. |
Yes | |
| results | macierz | Wyniki wywołania narzędzia wyszukiwania plików. |
No | |
| rola | wyliczenie | Rola komunikatu wyjściowego. Zawsze assistant.Możliwe wartości: assistant |
Yes | |
| stan | wyliczenie | Stan elementu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
Yes | |
| typ | wyliczenie | Typ obiektu. Zawsze reasoning.Możliwe wartości: reasoning |
Yes |
OutputMessage
Komunikat wyjściowy z modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | macierz | Zawartość komunikatu wyjściowego. |
Yes | |
| id | ciąg | Unikatowy identyfikator komunikatu wyjściowego. |
Yes | |
| rola | wyliczenie | Rola komunikatu wyjściowego. Zawsze assistant.Możliwe wartości: assistant |
Yes | |
| stan | wyliczenie | Stan danych wejściowych komunikatu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy wejściowe są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
Yes | |
| typ | wyliczenie | Typ komunikatu wyjściowego. Zawsze message.Możliwe wartości: message |
Yes |
OutputText
Dane wyjściowe tekstowe z modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| annotations | macierz | Adnotacje tekstu wyjściowego. |
Yes | |
| SMS | ciąg | Dane wyjściowe tekstu z modelu. |
Yes | |
| typ | wyliczenie | Typ tekstu wyjściowego. Zawsze output_text.Możliwe wartości: output_text |
Yes |
RealtimeSessionCreateRequest
Konfiguracja obiektu sesji w czasie rzeczywistym.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| input_audio_format | wyliczenie | Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.W przypadku pcm16 dźwięk wejściowy musi być w formacie 16-bitowego PCM z częstotliwością próbkowania 24 kHz, z pojedynczym kanałem (mono) i w kolejności bajtów małobitowej.Możliwe wartości: pcm16, , g711_ulawg711_alaw |
No | |
| input_audio_noise_reduction | obiekt | Konfiguracja redukcji szumu dźwięku wejściowego. Można to ustawić tak, null aby wyłączyć.Filtry redukcji szumów przetwarzają dźwięk dodany do wejściowego bufora audio, zanim zostanie on wysłany do usługi VAD i modelu. Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i zmian (zmniejszając liczbę fałszywie dodatnich wyników) oraz poprawić wydajność modelu poprzez polepszenie postrzegania dźwięku wejściowego. |
No | |
| └typ | wyliczenie | Typ redukcji szumu.
near_field jest przeznaczony dla mikrofonów kierunkowych, takich jak te w słuchawkach, podczas gdy far_field jest przeznaczony dla mikrofonów dalekiego pola, takich jak te w laptopie lub w salach konferencyjnych.Możliwe wartości: near_field, far_field |
No | |
| input_audio_transcription | obiekt | Konfiguracja transkrypcji dźwięku wejściowego, domyślnie wyłączona i może być ustawiona na null, aby wyłączyć po włączeniu. Transkrypcja audio wejściowego nie jest natywna dla modelu, ponieważ model korzysta bezpośrednio z dźwięku. Transkrypcja jest uruchamiana asynchronicznie za pośrednictwem punktu końcowego transkrypcji i powinna być traktowana jako wskazówki dotyczące wejściowej zawartości audio, a nie dokładnie tego, co usłyszał model. Klient ma możliwość ustawienia języka oraz wybrania opcji monitowania o transkrypcję, co zapewnia dodatkowe wskazówki dla usługi transkrypcyjnej. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie. |
No | |
| Model └* | ciąg | Model używany do transkrypcji, bieżące opcje to gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15i whisper-1. |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. W przypadku whisper-1 polecenie to lista słów kluczowych.W przypadku gpt-4o-transcribe modeli instrukcja jest wolnym ciągiem tekstowym, na przykład "oczekuj słów związanych z technologią". |
No | |
| instructions | ciąg | Domyślne instrukcje systemowe (tj. komunikat systemowy) są poprzedzane wywołaniami modelu. To pole umożliwia klientowi kierowanie odpowiedziami modelu w pożądany sposób. Model może być poinstruowany na temat zawartości i formatu odpowiedzi (np. "być bardzo zwięzły", "działać przyjazny", "oto przykłady dobrych odpowiedzi") i zachowania audio (np. "szybko rozmawiać", "wstrzykiwanie emocji do głosu", "śmiać się często"). Instrukcje nie gwarantują, że będą przestrzegane przez model, ale zapewniają przewodnictwo dotyczące pożądanego zachowania modelu. Należy pamiętać, że serwer ustawia domyślne instrukcje, które będą używane, jeśli to pole nie jest ustawione i są widoczne w session.created zdarzeniu na początku sesji. |
No | |
| max_response_output_tokens | liczba całkowita lub ciąg | Maksymalna liczba tokenów wyjściowych dla pojedynczej odpowiedzi asystenta, w tym wywołań narzędzi. Podaj liczbę całkowitą z zakresu od 1 do 4096, aby ograniczyć liczbę tokenów wyjściowych, lub użyj inf dla maksymalnej liczby dostępnych tokenów dla danego modelu. Wartość domyślna to inf. |
No | |
| modalities | Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"]. |
No | ||
| model | ciąg | Nazwa wdrożenia używanego na potrzeby tej sesji. |
No | |
| output_audio_format | wyliczenie | Format dźwięku wyjściowego. Opcje to pcm16, g711_ulawlub g711_alaw.W przypadku pcm16parametru dźwięk wyjściowy jest próbkowany z szybkością 24kHz.Możliwe wartości: pcm16, , g711_ulawg711_alaw |
No | |
| temperature | number | Temperatura próbkowania dla modelu ograniczona do [0.6, 1.2]. W przypadku modeli audio temperatura 0,8 jest zdecydowanie zalecana w celu uzyskania najlepszej wydajności. |
No | 0.8 |
| tool_choice | ciąg | W jaki sposób model wybiera narzędzia. Opcje to auto, none, requiredlub określają funkcję. |
No | auto |
| tools | macierz | Narzędzia (funkcje) dostępne dla modelu. | No | |
| turn_detection | obiekt | Konfiguracja wykrywania zmian, albo Server VAD lub Semantic VAD. Można ustawić to na null aby wyłączyć, co spowoduje, że klient będzie musiał ręcznie wyzwolić odpowiedź modelu.Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika. Semantyczna funkcja VAD jest bardziej zaawansowana i używa modelu wykrywania zmiany mówcy (w połączeniu z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie określa limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika zacznie zanikać uhhm, model oceni niskie prawdopodobieństwo zakończenia wypowiedzi i poczeka dłużej na to, aby użytkownik kontynuował mowę. Może to być przydatne w przypadku bardziej naturalnych rozmów, ale może mieć większe opóźnienie. |
No | |
| └create_response | boolean | Określenie, czy odpowiedź powinna być automatycznie generowana po wystąpieniu zdarzenia zatrzymania VAD. |
No | True |
| └* gotowość | wyliczenie | Używane tylko w semantic_vad trybie. Gotowość modelu do reagowania.
low będzie czekać dłużej, aż użytkownik będzie nadal mówić, high będzie reagować szybciej.
auto jest wartością domyślną i jest odpowiednikiem medium.Możliwe wartości: low, , medium, highauto |
No | |
| └reakcja_na_przerwanie | boolean | Określa, czy automatycznie przerywać bieżącą odpowiedź na rzecz wyjścia do domyślnej konwersacji (tj. conversation) po wystąpieniu zdarzenia rozpoczęcia VAD (tj. auto). |
No | True |
| └─prefix_padding_ms | liczba całkowita | Używane tylko w server_vad trybie. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Używane tylko w server_vad trybie. Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika. |
No | |
| └* próg | number | Używane tylko w server_vad trybie. Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach. |
No | |
| └typ | wyliczenie | Typ wykrywania zakrętów. Możliwe wartości: server_vad, semantic_vad |
No | |
| voice | VoiceIdsShared | No |
RealtimeSessionCreateResponse
Nowa konfiguracja sesji w czasie rzeczywistym z kluczem efemerycznym. Domyślny czas wygaśnięcia kluczy to jedna minuta.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| client_secret | obiekt | Klucz efemeryczny zwrócony przez API. | Yes | |
| └─ wygasa_o | liczba całkowita | Sygnatura czasowa dla czasu wygaśnięcia tokenu. Obecnie wszystkie tokeny wygasają po jednej minucie. |
No | |
| └─ wartość | ciąg | Klucz efemeryczny używany w środowiskach klienckich do uwierzytelniania połączeń z interfejsem API czasu rzeczywistego. Użyj tego w środowiskach po stronie klienta, zamiast standardowego tokena interfejsu API, którego należy używać tylko po stronie serwera. |
No | |
| input_audio_format | ciąg | Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw. |
No | |
| input_audio_transcription | obiekt | Konfiguracja transkrypcji dźwięku wejściowego, domyślnie wyłączona i może być ustawiona na null, aby wyłączyć po włączeniu. Transkrypcja audio wejściowego nie jest natywna dla modelu, ponieważ model korzysta bezpośrednio z dźwięku. Transkrypcja jest uruchamiana asynchronicznie przez Whisper i powinna być traktowana jako orientacyjna wskazówka, a nie reprezentacja rozumiana przez model. |
No | |
| Model └* | ciąg | Model używany do transkrypcji whisper-1 jest jedynym obecnie obsługiwanym modelem. |
No | |
| instructions | ciąg | Domyślne instrukcje systemowe (tj. komunikat systemowy) są poprzedzane wywołaniami modelu. To pole umożliwia klientowi kierowanie odpowiedziami modelu w pożądany sposób. Model może być poinstruowany na temat zawartości i formatu odpowiedzi (np. "bądź bardzo zwięzły", "bądź przyjazny", "oto przykłady dobrych odpowiedzi") oraz dotyczące zachowania audio (np. "mów szybko", "wkładaj emocje w swój głos", "śmiej się często"). Instrukcje nie gwarantują, że będą przestrzegane przez model, ale zapewniają przewodnictwo dotyczące pożądanego zachowania modelu. Należy pamiętać, że serwer ustawia domyślne instrukcje, które będą używane, jeśli to pole nie jest ustawione i są widoczne w session.created zdarzeniu na początku sesji. |
No | |
| max_response_output_tokens | liczba całkowita lub ciąg | Maksymalna liczba tokenów wyjściowych dla pojedynczej odpowiedzi asystenta, w tym wywołań narzędzi. Podaj liczbę całkowitą z zakresu od 1 do 4096, aby ograniczyć liczbę tokenów wyjściowych, lub użyj inf dla maksymalnej liczby dostępnych tokenów dla danego modelu. Wartość domyślna to inf. |
No | |
| modalities | Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"]. |
No | ||
| output_audio_format | ciąg | Format dźwięku wyjściowego. Opcje to pcm16, g711_ulawlub g711_alaw. |
No | |
| temperature | number | Temperatura próbkowania dla modelu ograniczona do [0.6, 1.2]. Wartość domyślna to 0.8. |
No | |
| tool_choice | ciąg | W jaki sposób model wybiera narzędzia. Opcje to auto, none, requiredlub określają funkcję. |
No | |
| tools | macierz | Narzędzia (funkcje) dostępne dla modelu. | No | |
| turn_detection | obiekt | Konfiguracja wykrywania obrotu.
null można ustawić, aby wyłączyć. Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika. |
No | |
| └─prefix_padding_ms | liczba całkowita | Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika. |
No | |
| └* próg | number | Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach. |
No | |
| └typ | ciąg | Typ wykrywania skrętu, obecnie obsługiwany jest tylko server_vad. |
No | |
| voice | VoiceIdsShared | No |
RealtimeTranscriptionSessionCreateRequest
Konfiguracja obiektu sesji transkrypcji w czasie rzeczywistym.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| include | macierz | Zestaw elementów do uwzględnienia w transkrypcji. Bieżące dostępne elementy to: - item.input_audio_transcription.logprobs |
No | |
| input_audio_format | wyliczenie | Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.W przypadku pcm16 dźwięk wejściowy musi być w formacie 16-bitowego PCM z częstotliwością próbkowania 24 kHz, z pojedynczym kanałem (mono) i w kolejności bajtów małobitowej.Możliwe wartości: pcm16, , g711_ulawg711_alaw |
No | |
| input_audio_noise_reduction | obiekt | Konfiguracja redukcji szumu dźwięku wejściowego. Można to ustawić tak, null aby wyłączyć.Filtry redukcji szumów przetwarzają dźwięk dodany do wejściowego bufora audio, zanim zostanie on wysłany do usługi VAD i modelu. Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i zmian (zmniejszając liczbę fałszywie dodatnich wyników) oraz poprawić wydajność modelu poprzez polepszenie postrzegania dźwięku wejściowego. |
No | |
| └typ | wyliczenie | Typ redukcji szumu.
near_field jest przeznaczony dla mikrofonów kierunkowych, takich jak te w słuchawkach, podczas gdy far_field jest przeznaczony dla mikrofonów dalekiego pola, takich jak te w laptopie lub w salach konferencyjnych.Możliwe wartości: near_field, far_field |
No | |
| input_audio_transcription | obiekt | Konfiguracja transkrypcji dźwięku wejściowego. Klient ma możliwość ustawienia języka oraz wybrania opcji monitowania o transkrypcję, co zapewnia dodatkowe wskazówki dla usługi transkrypcyjnej. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie. |
No | |
| Model └* | wyliczenie | Model używany do transkrypcji, bieżące opcje to gpt-4o-transcribe, , gpt-4o-transcribe-diarizegpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15i whisper-1.Możliwe wartości: gpt-4o-transcribe, , gpt-4o-transcribe-diarizegpt-4o-mini-transcribe, , gpt-4o-mini-transcribe-2025-12-15whisper-1 |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. W przypadku whisper-1 polecenie to lista słów kluczowych.W przypadku gpt-4o-transcribe modeli instrukcja jest wolnym ciągiem tekstowym, na przykład "oczekuj słów związanych z technologią". |
No | |
| modalities | Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"]. |
No | ||
| turn_detection | obiekt | Konfiguracja wykrywania zmian, albo Server VAD lub Semantic VAD. Można ustawić to na null aby wyłączyć, co spowoduje, że klient będzie musiał ręcznie wyzwolić odpowiedź modelu.Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika. Semantyczna funkcja VAD jest bardziej zaawansowana i używa modelu wykrywania zmiany mówcy (w połączeniu z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie określa limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika zacznie zanikać uhhm, model oceni niskie prawdopodobieństwo zakończenia wypowiedzi i poczeka dłużej na to, aby użytkownik kontynuował mowę. Może to być przydatne w przypadku bardziej naturalnych rozmów, ale może mieć większe opóźnienie. |
No | |
| └create_response | boolean | Określenie, czy odpowiedź powinna być automatycznie generowana po wystąpieniu zdarzenia zatrzymania VAD. Niedostępne dla sesji transkrypcji. |
No | True |
| └* gotowość | wyliczenie | Używane tylko w semantic_vad trybie. Gotowość modelu do reagowania.
low będzie czekać dłużej, aż użytkownik będzie nadal mówić, high będzie reagować szybciej.
auto jest wartością domyślną i jest odpowiednikiem medium.Możliwe wartości: low, , medium, highauto |
No | |
| └reakcja_na_przerwanie | boolean | Określa, czy automatycznie przerywać bieżącą odpowiedź na rzecz wyjścia do domyślnej konwersacji (tj. conversation) po wystąpieniu zdarzenia rozpoczęcia VAD (tj. auto). Niedostępne dla sesji transkrypcji. |
No | True |
| └─prefix_padding_ms | liczba całkowita | Używane tylko w server_vad trybie. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Używane tylko w server_vad trybie. Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika. |
No | |
| └* próg | number | Używane tylko w server_vad trybie. Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach. |
No | |
| └typ | wyliczenie | Typ wykrywania zakrętów. Możliwe wartości: server_vad, semantic_vad |
No |
RealtimeTranscriptionSessionCreateResponse
Nowa konfiguracja sesji transkrypcji w czasie rzeczywistym.
Po utworzeniu sesji na serwerze za pośrednictwem interfejsu API REST obiekt sesji zawiera również klucz efemeryczny. Domyślny czas wygaśnięcia kluczy to jedna minuta. Ta właściwość nie jest obecna, gdy sesja jest aktualizowana za pośrednictwem interfejsu API protokołu WebSocket.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| client_secret | obiekt | Klucz efemeryczny zwrócony przez API. Występuje tylko wtedy, gdy sesja jest tworzona na serwerze za pośrednictwem interfejsu API REST. |
Yes | |
| └─ wygasa_o | liczba całkowita | Sygnatura czasowa dla czasu wygaśnięcia tokenu. Obecnie wszystkie tokeny wygasają po jednej minucie. |
No | |
| └─ wartość | ciąg | Klucz efemeryczny używany w środowiskach klienckich do uwierzytelniania połączeń z interfejsem API czasu rzeczywistego. Użyj tego w środowiskach po stronie klienta, zamiast standardowego tokena interfejsu API, którego należy używać tylko po stronie serwera. |
No | |
| input_audio_format | ciąg | Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw. |
No | |
| input_audio_transcription | obiekt | Konfiguracja modelu transkrypcji. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie. |
No | |
| Model └* | wyliczenie | Model używany do transkrypcji. Może to być gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15lub whisper-1.Możliwe wartości: gpt-4o-transcribe, , gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15whisper-1 |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Komunikat powinien być zgodny z językiem dźwięku. |
No | |
| modalities | Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"]. |
No | ||
| turn_detection | obiekt | Konfiguracja wykrywania obrotu.
null można ustawić, aby wyłączyć. Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika. |
No | |
| └─prefix_padding_ms | liczba całkowita | Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika. |
No | |
| └* próg | number | Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach. |
No | |
| └typ | ciąg | Typ wykrywania skrętu, obecnie obsługiwany jest tylko server_vad. |
No |
Reasoning
Opcje konfiguracji dla modeli rozumowania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| nakład pracy | ReasoningEffort | Ogranicza nakład pracy na rozumowanie modeli rozumowania. Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi. |
Yes | nośnik |
| podsumowanie | wyliczenie | Podsumowanie rozumowania wykonywanego przez model. Może to być przydatne do debugowania i zrozumienia procesu rozumowania modelu. Jeden z concise lub detailed.Możliwe wartości: concise, detailed |
No |
ReasoningItem
Opis łańcucha myśli używanego przez model rozumowania podczas generowania odpowiedzi.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| zawartość | macierz | Analiza zawartości tekstu. |
Yes | |
| id | ciąg | Unikatowy identyfikator zawartości rozumowania. |
Yes | |
| stan | wyliczenie | Stan elementu.
in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.Możliwe wartości: in_progress, , completedincomplete |
No | |
| typ | wyliczenie | Typ obiektu. Zawsze reasoning.Możliwe wartości: reasoning |
Yes |
Refusal
Odmowa ze strony modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| refusal | ciąg | Wyjaśnienie odmowy dostarczone przez model. |
Yes | |
| typ | wyliczenie | Rodzaj odmowy. Zawsze refusal.Możliwe wartości: refusal |
Yes |
response
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| created_at | number | Sygnatura czasowa systemu Unix (w sekundach) czasu utworzenia tej odpowiedzi. |
Yes | |
| błąd | ResponseError | Obiekt błędu zwracany, gdy model nie może wygenerować odpowiedzi. |
Yes | |
| id | ciąg | Unikatowy identyfikator tej odpowiedzi. |
Yes | |
| incomplete_details | obiekt | Szczegółowe informacje o tym, dlaczego odpowiedź jest niekompletna. |
Yes | |
| └* przyczyna | wyliczenie | Powód, dla którego odpowiedź jest niekompletna. Możliwe wartości: max_output_tokens, content_filter |
No | |
| instructions | ciąg | Wstawia komunikat systemu (lub dewelopera) jako pierwszy element w kontekście modelu. Podczas używania previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia proste wymienianie komunikatów systemowych lub komunikatów od deweloperów w nowych odpowiedziach. |
Yes | |
| max_output_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widoczne tokeny wyjściowe i stan konwersacji. |
No | |
| metadane | Metadata | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków. |
Yes | |
| model | ciąg | Model używany do generowania odpowiedzi. | Yes | |
| obiekt | wyliczenie | Typ obiektu tego zasobu — zawsze ustawiony na response.Możliwe wartości: response |
Yes | |
| We/Wy | macierz | Tablica elementów zawartości wygenerowanych przez model. — Długość i kolejność elementów w output tablicy zależy od odpowiedzi modelu.— Zamiast uzyskiwać dostęp do pierwszego elementu w output tablicy i zakładając, że jest to komunikat z zawartością wygenerowaną assistant przez model, możesz rozważyć użycie output_text właściwości, która jest obsługiwana w zestawach SDK. |
Yes | |
| output_text | ciąg | Właściwość przeznaczona tylko dla zestawu SDK, która zawiera zagregowane dane wyjściowe tekstu ze wszystkich elementów w tablicy output_text, jeśli takowe istnieją. Obsługiwane w zestawach SDK python i JavaScript. |
No | |
| parallel_tool_calls | boolean | Czy zezwolić modelowi na równoległe uruchamianie wywołań narzędzi. |
Yes | True |
| previous_response_id | ciąg | Unikatowy identyfikator poprzedniej odpowiedzi na model. Użyj tego, aby utworzyć wielokrotne konwersacje. | No | |
| reasoning | Reasoning | Opcje konfiguracji dla modeli rozumowania. |
No | |
| stan | wyliczenie | Stan generowania odpowiedzi.
completedJeden z , failed, in_progresslub incomplete.Możliwe wartości: completed, , failed, in_progressincomplete |
No | |
| temperature | number | Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie. |
Yes | 1 |
| SMS | obiekt | Opcje konfiguracji generowania odpowiedzi tekstowej przez model. Może to być zwykły tekst lub dane JSON ze strukturą. Więcej informacji: - wprowadzanie tekstu i dane wyjściowe - Ustrukturyzowane wyniki |
No | |
| Format └─ | TextResponseFormatConfiguration | Obiekt określający format, który musi zostać wygenerowany przez model. Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, co zapewnia, że model jest zgodny ze podanym schematem JSON. Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.Niezalecane w przypadku modeli gpt-4o i nowszych: Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują. |
No | |
| tool_choice | ToolChoiceOptions lub ToolChoiceTypes lub ToolChoiceFunction | W jaki sposób model powinien wybrać narzędzie (lub narzędzia), które ma być używane podczas generowania odpowiedzi. Zobacz parametr , tools aby zobaczyć, jak określić narzędzia, które może wywołać model. |
Yes | |
| tools | macierz | Tablica narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając tool_choice parametr .Dwie kategorie narzędzi, które można modelowi podać, to: - Wbudowane narzędzia |
Yes | |
| top_p | number | Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa. Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie. |
Yes | 1 |
| truncation | wyliczenie | Strategia obcinania, która ma być użyta dla odpowiedzi modelu. - auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstu modelu, model obcina odpowiedź, aby dopasować okno kontekstu, upuszczając elementy wejściowe w środku konwersacji. - disabled (ustawienie domyślne): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstu dla modelu, żądanie zakończy się niepowodzeniem z powodu błędu 400.Możliwe wartości: auto, disabled |
No | |
| użycie | ResponseUsage | Reprezentuje szczegóły użycia tokenu, w tym tokeny wejściowe, tokeny wyjściowe, podział tokenów wyjściowych i łączną liczbę użytych tokenów. |
No | |
| użytkownik | ciąg | Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc usłudze OpenAI w monitorowaniu i wykrywaniu nadużyć. . |
No |
ResponseAudioDeltaEvent
Występuje w przypadku częściowej odpowiedzi głosowej.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| delta | ciąg | Fragment bajtów audio odpowiedzi zakodowanych w formacie Base64. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.audio.delta.Możliwe wartości: response.audio.delta |
Yes |
ResponseAudioDoneEvent
Emitowane po zakończeniu odpowiedzi audio.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Typ zdarzenia. Zawsze response.audio.done.Możliwe wartości: response.audio.done |
Yes |
ResponseAudioTranscriptDeltaEvent
Emitowane w przypadku częściowej transkrypcji dźwięku.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| delta | ciąg | Częściowa transkrypcja odpowiedzi audio. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.audio.transcript.delta.Możliwe wartości: response.audio.transcript.delta |
Yes |
ResponseAudioTranscriptDoneEvent
Emitowany po zakończeniu pełnej transkrypcji audio.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Typ zdarzenia. Zawsze response.audio.transcript.done.Możliwe wartości: response.audio.transcript.done |
Yes |
ResponseCodeInterpreterCallCodeDeltaEvent
Emitowane, gdy częściowy fragment kodu jest dodawany przez interpreter kodu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| delta | ciąg | Fragment kodu dodany przez interpreter kodu. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.code_interpreter_call.code.delta.Możliwe wartości: response.code_interpreter_call.code.delta |
Yes |
ResponseCodeInterpreterCallCodeDoneEvent
Emitowane, gdy dane wyjściowe fragmentu kodu są finalizowane przez interpreter kodu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| kod | ciąg | Ostateczny wynik fragmentu kodu generowany przez interpretatora kodu. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.code_interpreter_call.code.done.Możliwe wartości: response.code_interpreter_call.code.done |
Yes |
ResponseCodeInterpreterCallCompletedEvent
Emitowane po zakończeniu wywołania interpretera kodu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| code_interpreter_call | CodeInterpreterToolCall | Wywołanie narzędzia w celu uruchomienia kodu. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.code_interpreter_call.completed.Możliwe wartości: response.code_interpreter_call.completed |
Yes |
ResponseCodeInterpreterCallInProgressEvent
Emitowane, gdy trwa wywołanie interpretera kodu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| code_interpreter_call | CodeInterpreterToolCall | Wywołanie narzędzia w celu uruchomienia kodu. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.code_interpreter_call.in_progress.Możliwe wartości: response.code_interpreter_call.in_progress |
Yes |
ResponseCodeInterpreterCallInterpretingEvent
Emitowane, gdy interpreter kodu aktywnie interpretuje fragment kodu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| code_interpreter_call | CodeInterpreterToolCall | Wywołanie narzędzia w celu uruchomienia kodu. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.code_interpreter_call.interpreting.Możliwe wartości: response.code_interpreter_call.interpreting |
Yes |
ResponseCompletedEvent
Emitowane po zakończeniu odpowiedzi modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| response | response | Yes | ||
| typ | wyliczenie | Typ zdarzenia. Zawsze response.completed.Możliwe wartości: response.completed |
Yes |
ResponseContentPartAddedEvent
Emitowane po dodaniu nowej części zawartości.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks dodanej części zawartości. |
Yes | |
| item_id | ciąg | Identyfikator elementu wyjściowego, do którego została dodana część zawartości. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego została dodana część zawartości. |
Yes | |
| part | OutputContent | Yes | ||
| typ | wyliczenie | Typ zdarzenia. Zawsze response.content_part.added.Możliwe wartości: response.content_part.added |
Yes |
ResponseContentPartDoneEvent
Emitowane po zakończeniu części zawartości.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części zawartości, która jest ukończona. |
Yes | |
| item_id | ciąg | Identyfikator elementu wyjściowego, do którego została dodana część zawartości. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego została dodana część zawartości. |
Yes | |
| part | OutputContent | Yes | ||
| typ | wyliczenie | Typ zdarzenia. Zawsze response.content_part.done.Możliwe wartości: response.content_part.done |
Yes |
ResponseCreatedEvent
Zdarzenie emitowane podczas tworzenia odpowiedzi.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| response | response | Yes | ||
| typ | wyliczenie | Typ zdarzenia. Zawsze response.created.Możliwe wartości: response.created |
Yes |
ResponseError
Obiekt błędu zwracany, gdy model nie może wygenerować odpowiedzi.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| kod | ResponseErrorCode | Kod błędu odpowiedzi. |
Yes | |
| komunikat | ciąg | Czytelny dla człowieka opis błędu. |
Yes |
ResponseErrorCode
Kod błędu odpowiedzi.
| Property | Value |
|---|---|
| Description | Kod błędu odpowiedzi. |
| Type | ciąg |
| Values | server_errorrate_limit_exceededinvalid_promptvector_store_timeoutinvalid_imageinvalid_image_formatinvalid_base64_imageinvalid_image_urlimage_too_largeimage_too_smallimage_parse_errorimage_content_policy_violationinvalid_image_modeimage_file_too_largeunsupported_image_media_typeempty_image_filefailed_to_download_imageimage_file_not_found |
ResponseErrorEvent
Emitowane w przypadku wystąpienia błędu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| kod | ciąg | Kod błędu. |
Yes | |
| komunikat | ciąg | Komunikat o błędzie. |
Yes | |
| param | ciąg | Parametr błędu. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze error.Możliwe wartości: error |
Yes |
ResponseFailedEvent
Zdarzenie emitowane w przypadku niepowodzenia odpowiedzi.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| response | response | Yes | ||
| typ | wyliczenie | Typ zdarzenia. Zawsze response.failed.Możliwe wartości: response.failed |
Yes |
ResponseFileSearchCallCompletedEvent
Emitowane po zakończeniu wywołania wyszukiwania plików (znaleziono wyniki).
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| item_id | ciąg | Identyfikator elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.file_search_call.completed.Możliwe wartości: response.file_search_call.completed |
Yes |
ResponseFileSearchCallInProgressEvent
Emitowane po zainicjowaniu wywołania wyszukiwania plików.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| item_id | ciąg | Identyfikator elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.file_search_call.in_progress.Możliwe wartości: response.file_search_call.in_progress |
Yes |
ResponseFileSearchCallSearchingEvent
Emitowane, gdy wyszukiwanie plików jest obecnie przeszukiwane.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| item_id | ciąg | Identyfikator elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego przeszukiwanego przez wywołanie wyszukiwania plików. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.file_search_call.searching.Możliwe wartości: response.file_search_call.searching |
Yes |
ResponseFunctionCallArgumentsDeltaEvent
Emitowane, gdy występuje różnica w argumentach wywołania funkcji częściowej.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| delta | ciąg | Dodano argument delta w wywołaniu funkcji. |
Yes | |
| item_id | ciąg | Identyfikator elementu wyjściowego, do którego dodano różnicę argumentów wywołania funkcji. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego do którego zostanie dodana różnica w argumentach wywołania funkcji. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.function_call_arguments.delta.Możliwe wartości: response.function_call_arguments.delta |
Yes |
ResponseFunctionCallArgumentsDoneEvent
Emitowane, gdy argumenty wywołania funkcji są finalizowane.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| arguments | ciąg | Argumenty wywołania funkcji. | Yes | |
| item_id | ciąg | Identyfikator elementu. | Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego. | Yes | |
| typ | wyliczenie | Możliwe wartości: response.function_call_arguments.done |
Yes |
ResponseInProgressEvent
Emitowane, gdy odpowiedź jest w toku.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| response | response | Yes | ||
| typ | wyliczenie | Typ zdarzenia. Zawsze response.in_progress.Możliwe wartości: response.in_progress |
Yes |
ResponseIncompleteEvent
Zdarzenie emitowane, gdy odpowiedź jest zakończona jako niekompletna.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| response | response | Yes | ||
| typ | wyliczenie | Typ zdarzenia. Zawsze response.incomplete.Możliwe wartości: response.incomplete |
Yes |
responseItemList
Lista elementów odpowiedzi.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Lista elementów używanych do wygenerowania tej odpowiedzi. | Yes | |
| first_id | ciąg | Identyfikator pierwszego elementu na liście. | Yes | |
| has_more | boolean | Czy dostępnych jest więcej elementów? | Yes | |
| last_id | ciąg | Identyfikator ostatniego elementu na liście. | Yes | |
| obiekt | wyliczenie | Zwracany typ obiektu musi mieć wartość list.Możliwe wartości: list |
Yes |
ResponseModalities
Typy danych wyjściowych, które mają być generowane przez model. Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną:
["text"]
Model gpt-4o-audio-preview może również służyć do generowania dźwięku. Aby zażądać, aby ten model wygenerował odpowiedzi tekstowe i audio, możesz użyć:
["text", "audio"]
Brak zdefiniowanych właściwości dla tego składnika.
ResponseModalitiesTextOnly
Typy danych wyjściowych, które mają być generowane przez model. Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną:
["text"]
Ten interfejs API wkrótce będzie obsługiwał inne modalności danych wyjściowych, w tym audio i obrazy.
Brak zdefiniowanych właściwości dla tego składnika.
ResponseOutputItemAddedEvent
Emitowane po dodaniu nowego elementu wyjściowego.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| element | OutputItem | Yes | ||
| output_index | liczba całkowita | Indeks dodanego elementu wyjściowego. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.output_item.added.Możliwe wartości: response.output_item.added |
Yes |
ResponseOutputItemDoneEvent
Emitowane, gdy element wyjściowy jest oznaczony jako zakończony.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| element | OutputItem | Yes | ||
| output_index | liczba całkowita | Indeks elementu wyjściowego, który został oznaczony jako wykonany. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.output_item.done.Możliwe wartości: response.output_item.done |
Yes |
ResponseProperties
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| instructions | ciąg | Wstawia komunikat systemu (lub dewelopera) jako pierwszy element w kontekście modelu. Podczas używania previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia proste wymienianie komunikatów systemowych lub komunikatów od deweloperów w nowych odpowiedziach. |
No | |
| max_output_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widoczne tokeny wyjściowe i stan konwersacji. |
No | |
| previous_response_id | ciąg | Unikatowy identyfikator poprzedniej odpowiedzi na model. Użyj tego, aby utworzyć wielokrotne konwersacje. | No | |
| reasoning | Reasoning | Opcje konfiguracji dla modeli rozumowania. |
No | |
| SMS | obiekt | Opcje konfiguracji generowania odpowiedzi tekstowej przez model. Może to być zwykły tekst lub dane JSON ze strukturą. Więcej informacji: - wprowadzanie tekstu i dane wyjściowe - Ustrukturyzowane wyniki |
No | |
| Format └─ | TextResponseFormatConfiguration | Obiekt określający format, który musi zostać wygenerowany przez model. Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, co zapewnia, że model jest zgodny ze podanym schematem JSON. Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.Niezalecane w przypadku modeli gpt-4o i nowszych: Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują. |
No | |
| tool_choice | ToolChoiceOptions lub ToolChoiceTypes lub ToolChoiceFunction | W jaki sposób model powinien wybrać narzędzie (lub narzędzia), które ma być używane podczas generowania odpowiedzi. Zobacz parametr , tools aby zobaczyć, jak określić narzędzia, które może wywołać model. |
No | |
| tools | macierz | Tablica narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając tool_choice parametr .Dwie kategorie narzędzi, które można modelowi podać, to: - Wbudowane narzędzia |
No | |
| truncation | wyliczenie | Strategia obcinania, która ma być użyta dla odpowiedzi modelu. - auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstu modelu, model obcina odpowiedź, aby dopasować okno kontekstu, upuszczając elementy wejściowe w środku konwersacji. - disabled (ustawienie domyślne): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstu dla modelu, żądanie zakończy się niepowodzeniem z powodu błędu 400.Możliwe wartości: auto, disabled |
No |
ResponseRefusalDeltaEvent
Emitowane w przypadku częściowego tekstu odmowy.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części zawartości, do którego jest dodawany tekst odmowy. |
Yes | |
| delta | ciąg | Tekst odmowy, który został dodany. |
Yes | |
| item_id | ciąg | Identyfikator elementu wyjściowego, do którego jest dodawany tekst odmowy. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego jest dodawany tekst odmowy. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.refusal.delta.Możliwe wartości: response.refusal.delta |
Yes |
ResponseRefusalDoneEvent
Emitowane, gdy tekst odmowy jest sfinalizowany.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części treści, w której tekst odmowy jest sfinalizowany. |
Yes | |
| item_id | ciąg | Identyfikator elementu wyjściowego, dla którego tekst odmowy jest finalizowany. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, w którym tekst odmowy został sfinalizowany. |
Yes | |
| refusal | ciąg | Tekst odmowy, który jest sfinalizowany. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.refusal.done.Możliwe wartości: response.refusal.done |
Yes |
responseStreamEvent
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| adnotacja | Annotation | Yes | ||
| annotation_index | liczba całkowita | Indeks dodanej adnotacji. |
Yes | |
| arguments | ciąg | Argumenty wywołania funkcji. | Yes | |
| kod | ciąg | Kod błędu. |
Yes | |
| code_interpreter_call | CodeInterpreterToolCall | Wywołanie narzędzia w celu uruchomienia kodu. |
Yes | |
| content_index | liczba całkowita | Indeks części zawartości, w której treść tekstowa jest sfinalizowana. |
Yes | |
| delta | ciąg | Dodano zmianę tekstu. |
Yes | |
| element | OutputItem | Element wyjściowy, który został oznaczony jako wykonany. |
Yes | |
| item_id | ciąg | Identyfikator elementu wyjściowego, którego zawartość tekstowa jest finalizowana. |
Yes | |
| komunikat | ciąg | Komunikat o błędzie. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, którego treść tekstowa jest sfinalizowana. |
Yes | |
| param | ciąg | Parametr błędu. |
Yes | |
| part | OutputContent | Część zawartości, która jest wykonywana. |
Yes | |
| refusal | ciąg | Tekst odmowy, który jest sfinalizowany. |
Yes | |
| response | response | Odpowiedź, która była niekompletna. |
Yes | |
| SMS | ciąg | Zawartość tekstowa, która jest sfinalizowana. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.output_text.done.Możliwe wartości: response.output_text.done |
Yes |
ResponseTextAnnotationDeltaEvent
Emitowane po dodaniu adnotacji tekstowej.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| adnotacja | Annotation | Yes | ||
| annotation_index | liczba całkowita | Indeks dodanej adnotacji. |
Yes | |
| content_index | liczba całkowita | Indeks części zawartości, do którego dodano adnotację tekstową. |
Yes | |
| item_id | ciąg | Identyfikator elementu wyjściowego, do którego dodano adnotację tekstową. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego dodano adnotację tekstową. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.output_text.annotation.added.Możliwe wartości: response.output_text.annotation.added |
Yes |
ResponseTextDeltaEvent
Emitowane w przypadku dodatkowej zmiany tekstu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części zawartości, do której dodano zmianę tekstową. |
Yes | |
| delta | ciąg | Dodano zmianę tekstu. |
Yes | |
| item_id | ciąg | Identyfikator elementu wyjściowego, do którego dodano różnicę tekstu. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego dodano różnicę tekstu. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.output_text.delta.Możliwe wartości: response.output_text.delta |
Yes |
ResponseTextDoneEvent
Emitowane po sfinalizowaniu zawartości tekstowej.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części zawartości, w której treść tekstowa jest sfinalizowana. |
Yes | |
| item_id | ciąg | Identyfikator elementu wyjściowego, którego zawartość tekstowa jest finalizowana. |
Yes | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, którego treść tekstowa jest sfinalizowana. |
Yes | |
| SMS | ciąg | Zawartość tekstowa, która jest sfinalizowana. |
Yes | |
| typ | wyliczenie | Typ zdarzenia. Zawsze response.output_text.done.Możliwe wartości: response.output_text.done |
Yes |
ResponseUsage
Reprezentuje szczegóły użycia tokenu, w tym tokeny wejściowe, tokeny wyjściowe, podział tokenów wyjściowych i łączną liczbę użytych tokenów.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| input_tokens | liczba całkowita | Liczba tokenów wejściowych. | Yes | |
| output_tokens | liczba całkowita | Liczba tokenów wyjściowych. | Yes | |
| output_tokens_details | obiekt | Szczegółowy podział tokenów wyjściowych. | Yes | |
| └─ tokeny_rozumowania | liczba całkowita | Liczba tokenów rozumowania. | No | |
| total_tokens | liczba całkowita | Całkowita liczba użytych tokenów. | Yes |
Screenshot
Akcja zrzutu ekranu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Określa typ zdarzenia. W przypadku akcji zrzutu ekranu ta właściwość jest zawsze ustawiona na screenshot.Możliwe wartości: screenshot |
Yes |
Scroll
Akcja przewijania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| scroll_x | liczba całkowita | Odległość przewijania poziomego. |
Yes | |
| scroll_y | liczba całkowita | Odległość przewijania w pionie. |
Yes | |
| typ | wyliczenie | Określa typ zdarzenia. W przypadku akcji przewijania ta właściwość jest zawsze ustawiona na scroll.Możliwe wartości: scroll |
Yes | |
| x | liczba całkowita | Współrzędna x, w której wystąpiło przewijanie. |
Yes | |
| y | liczba całkowita | Współrzędna y, w której wystąpiło przewijanie. |
Yes |
StopConfiguration
Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny. Zwrócony tekst nie będzie zawierać sekwencji zatrzymania.
Ten składnik może być jednym z następujących elementów:
TextResponseFormatConfiguration
Obiekt określający format, który musi zostać wygenerowany przez model.
Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, które zapewniają, że model jest zgodny z podanym schematem JSON.
Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.
Niezalecane w przypadku modeli gpt-4o i nowszych:
Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują.
Ten składnik może być jednym z następujących elementów:
TextResponseFormatJsonSchema
Format odpowiedzi schematu JSON. Służy do generowania ustrukturyzowanych odpowiedzi JSON. Dowiedz się więcej o strukturach danych wyjściowych.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| description | ciąg | Opis celu formatu odpowiedzi, który jest używany przez model do określenia, jak odpowiedzieć w tym formacie. |
No | |
| name | ciąg | Nazwa formatu odpowiedzi. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków. |
No | |
| schemat | ResponseFormatJsonSchemaSchema | Schemat formatu odpowiedzi, opisany jako obiekt schematu JSON. | Yes | |
| strict | boolean | Czy włączyć ścisłe przestrzeganie schematu podczas generowania danych wyjściowych. W przypadku ustawienia wartości true model będzie zawsze przestrzegał dokładnego schematu zdefiniowanego schema w polu. Tylko podzbiór schematu JSON jest obsługiwany, gdy strict ma wartość true. |
No | False |
| typ | wyliczenie | Typ zdefiniowanego formatu odpowiedzi. Zawsze json_schema.Możliwe wartości: json_schema |
Yes |
Tool
Ten składnik może być jednym z następujących elementów:
ToolChoiceFunction
Użyj tej opcji, aby wymusić wywołanie określonej funkcji przez model.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| name | ciąg | Nazwa funkcji do wywołania. | Yes | |
| typ | wyliczenie | W przypadku wywoływania funkcji typ to zawsze function.Możliwe wartości: function |
Yes |
ToolChoiceOptions
Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie wywoła żadnego narzędzia i zamiast tego generuje komunikat.
auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia.
required oznacza, że model musi wywoływać co najmniej jedno narzędzie.
| Property | Value |
|---|---|
| Description | Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.none oznacza, że model nie wywoła żadnego narzędzia i zamiast tego generuje komunikat.auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia.required oznacza, że model musi wywoływać co najmniej jedno narzędzie. |
| Type | ciąg |
| Values | noneautorequired |
ToolChoiceTypes
Wskazuje, że model powinien używać wbudowanego narzędzia do generowania odpowiedzi.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Typ hostowanego narzędzia, którego powinien używać model. Dozwolone wartości to: - file_search- computer_use_previewMożliwe wartości: file_search, computer_use_preview |
Yes |
Typ
Akcja wpisywania tekstu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| SMS | ciąg | Tekst do wpisania. |
Yes | |
| typ | wyliczenie | Określa typ zdarzenia. Dla akcji typu, ten atrybut jest zawsze ustawiony na type.Możliwe wartości: type |
Yes |
UpdateVectorStoreFileAttributesRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| attributes | VectorStoreFileAttributes | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości logiczne lub liczby. |
Yes |
UrlCitation
Cytat dotyczący zasobu internetowego używanego do generowania odpowiedzi modelu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| end_index | liczba całkowita | Indeks ostatniego znaku cytatu adresu URL w komunikacie. |
Yes | |
| start_index | liczba całkowita | Indeks pierwszego znaku cytatu adresu URL w komunikacie. |
Yes | |
| title | ciąg | Tytuł zasobu internetowego. |
Yes | |
| typ | wyliczenie | Typ cytatu adresu URL. Zawsze url_citation.Możliwe wartości: url_citation |
Yes | |
| url | ciąg | Adres URL zasobu internetowego. |
Yes |
VectorStoreFileAttributes
Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości logiczne lub liczby.
Brak zdefiniowanych właściwości dla tego składnika.
VectorStoreFileContentResponse
Reprezentuje przeanalizowaną zawartość pliku magazynu wektorów.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Przeanalizowana zawartość pliku. | Yes | |
| has_more | boolean | Wskazuje, czy do pobrania jest więcej stron zawartości. | Yes | |
| next_page | ciąg | Znacznik następnej strony, jeśli istnieje. | Yes | |
| obiekt | wyliczenie | Typ obiektu, który jest zawsze vector_store.file_content.pageMożliwe wartości: vector_store.file_content.page |
Yes |
VectorStoreSearchRequest
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| filters | Filtr porównawczy lub filtr złożony | Filtr do zastosowania na podstawie atrybutów pliku. | No | |
| max_num_results | liczba całkowita | Maksymalna liczba wyników do zwrócenia. Ta liczba powinna należeć do zakresu od 1 do 50 włącznie. | No | 10 |
| kwerenda | ciąg lub tablica | Ciąg zapytania dla wyszukiwania | Yes | |
| ranking_options | obiekt | Opcje klasyfikacji wyszukiwania. | No | |
| └} ranker | wyliczenie | Możliwe wartości: auto, default-2024-11-15 |
No | |
| └─ próg_punktowy | number | No | 0 | |
| rewrite_query | boolean | Określa, czy należy ponownie napisać zapytanie języka naturalnego na potrzeby wyszukiwania wektorów. | No | False |
VectorStoreSearchResultContentObject
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| SMS | ciąg | Zawartość tekstowa z wyników wyszukiwania. | Yes | |
| typ | wyliczenie | Typ zawartości. Możliwe wartości: text |
Yes |
VectorStoreSearchResultItem
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| attributes | VectorStoreFileAttributes | Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości logiczne lub liczby. |
Yes | |
| zawartość | macierz | Fragmenty zawartości z pliku. | Yes | |
| file_id | ciąg | Identyfikator pliku magazynu wektorów. | Yes | |
| filename | ciąg | Nazwa pliku przechowującego wektory. | Yes | |
| wynik | number | Wynik oceny podobieństwa. | Yes |
VectorStoreSearchResultsPage
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | macierz | Lista elementów wyników wyszukiwania. | Yes | |
| has_more | boolean | Wskazuje, czy istnieje więcej wyników do pobrania. | Yes | |
| next_page | ciąg | Znacznik następnej strony, jeśli istnieje. | Yes | |
| obiekt | wyliczenie | Typ obiektu, który jest zawsze vector_store.search_results.pageMożliwe wartości: vector_store.search_results.page |
Yes | |
| search_query | macierz | Yes |
VoiceIdsShared
Brak zdefiniowanych właściwości dla tego składnika.
Wait
Akcja oczekiwania.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| typ | wyliczenie | Określa typ zdarzenia. W przypadku akcji oczekiwania ta właściwość jest zawsze ustawiona na wait.Możliwe wartości: wait |
Yes |
ReasoningEffort
Ogranicza nakład pracy na rozumowanie modeli rozumowania. Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi.
| Property | Value |
|---|---|
| Description | Ogranicza nakład pracy na rozumowanie modeli rozumowania. Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi. |
| Type | ciąg |
| Default | nośnik |
| Values | lowmediumhigh |
errorEvent
Występuje, gdy wystąpi błąd. Może się to zdarzyć z powodu wewnętrznego błędu serwera lub przekroczenia limitu czasu.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | error | Yes | ||
| wydarzenie | ciąg | Yes |
event Enum: ErrorEventEnum
| Value | Description |
|---|---|
| błąd |
doneEvent
Występuje po zakończeniu strumienia.
| Name | Typ | Description | Required | Default |
|---|---|---|---|---|
| dane | ciąg | Yes | ||
| wydarzenie | ciąg | Yes |
event Enum: DoneEventEnum
| Value | Description |
|---|---|
| done |
data Enum: DoneEventDataEnum
| Value | Description |
|---|---|
| [DONE] |
Dalsze kroki
Dowiedz się więcej o modelach i dostrajaniu za pomocą interfejsu API REST. Dowiedz się więcej o modelach bazowych, które zasilają usługę Azure OpenAI.