Udostępnij przez


Dokumentacja interfejsu API REST usługi Azure OpenAI w usłudze Microsoft Foundry Models

Uwaga / Notatka

Ten dokument odnosi się do portalu Microsoft Foundry (klasycznego).

🔍 Zapoznaj się z dokumentacją rozwiązania Microsoft Foundry (nową), aby dowiedzieć się więcej o nowym portalu.

Ten artykuł zawiera szczegółowe informacje na temat punktów końcowych interfejsu API REST wnioskowania dla usługi Azure OpenAI.

Specyfikacje interfejsu API

Zarządzanie modelami i zasobami Azure OpenAI oraz interakcja z nimi są podzielone na trzy podstawowe elementy interfejsu API.

  • Płaszczyzna sterowania
  • Płaszczyzna danych — tworzenie
  • Płaszczyzna danych — wnioskowanie

Każda powierzchnia/specyfikacja interfejsu API hermetyzuje inny zestaw funkcji usługi Azure OpenAI. Każdy interfejs API ma swój własny unikatowy zestaw wersji zapoznawczych i stabilne/ogólnie dostępne wersje interfejsu API. Obecnie wersje zapoznawcze zwykle podążają za miesięcznym harmonogramem.

Important

Teraz dostępny jest nowy interfejs API do wnioskowania w wersji zapoznawczej. Dowiedz się więcej w naszym przewodniku cyklu życia interfejsu API.

API Najnowsza wersja zapoznawcza Najnowsza wersja ogólnie dostępna Specifications Description
Płaszczyzna sterowania 2025-07-01-preview 2025-06-01 Pliki specyfikacji Interfejs API płaszczyzny sterowania służy do wykonywania operacji, takich jak tworzenie zasobów, wdrażanie modelu i inne zadania zarządzania zasobami wyższego poziomu. Płaszczyzna sterowania decyduje również o możliwościach wykorzystania takich narzędzi, jak Azure Resource Manager, Bicep, Terraform i Azure CLI.
Płaszczyzna danych v1 preview v1 Pliki specyfikacji Interfejs API płaszczyzny danych nadzoruje procesy wnioskowania i tworzenia.

Authentication

Usługa Azure OpenAI udostępnia dwie metody uwierzytelniania. Możesz użyć kluczy interfejsu API lub Microsoft Entra ID.

  • Uwierzytelnianie klucza interfejsu API: w przypadku tego typu uwierzytelniania wszystkie żądania interfejsu API muszą zawierać klucz interfejsu API w nagłówku api-key HTTP. Przewodnik Szybki start zawiera wskazówki dotyczące wykonywania wywołań przy użyciu tego typu uwierzytelniania.

  • Uwierzytelnianie identyfikatora Entra firmy Microsoft: możesz uwierzytelnić wywołanie interfejsu API przy użyciu tokenu Entra firmy Microsoft. Tokeny uwierzytelniania są dołączane do żądania jako nagłówka Authorization . Podany token musi być poprzedzony elementem Bearer, na przykład Bearer YOUR_AUTH_TOKEN. Możesz przeczytać nasz przewodnik z instrukcjami dotyczącymi uwierzytelniania za pomocą identyfikatora Entra firmy Microsoft.

Przechowywanie wersji interfejsu API REST

Interfejsy API usługi są wersjonowane za pomocą parametru api-version zapytania. Wszystkie wersje są zgodne ze strukturą dat RRRR-MM-DD. Przykład:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Wnioskowanie płaszczyzny danych

W pozostałej części artykułu omówiono 2025-04-01-preview wersję zapoznawczą specyfikacji wnioskowania płaszczyzny danych usługi Azure OpenAI.

Jeśli szukasz dokumentacji najnowszej wersji interfejsu API ga, zapoznaj się z najnowszym interfejsem API wnioskowania płaszczyzny danych ogólnie dostępnego

Uzupełnianie — tworzenie

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

Tworzy uzupełnienie dla podanej podpowiedzi, parametrów i wybranego modelu.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id ścieżka Yes ciąg
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
best_of liczba całkowita Generuje uzupełnienia best_of po stronie serwera i zwraca najlepszą (tę z najwyższym logarytmicznym prawdopodobieństwem na token). Nie można przesyłać strumieniowo wyników.

W przypadku użycia z n, best_of kontroluje liczbę możliwych uzupełnień, a n określa, ile należy zwrócić – best_of musi być większe niż n.

Uwaga: ponieważ ten parametr generuje wiele uzupełnień, może szybko wyczerpać przydział tokenów. Należy ostrożnie używać i upewnić się, że masz odpowiednie ustawienia dla max_tokens i stop.
No 1
echo boolean Powtórz ponownie monit oprócz ukończenia No False
frequency_penalty number Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza. No 0
logit_bias obiekt Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu.

Akceptuje obiekt JSON, który mapuje tokeny (określone przez ich identyfikator tokenu w tokenizatorze GPT) do odpowiadającej wartości uprzedzenia od -100 do 100. Matematycznie stronniczy jest dodawany do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu.

Na przykład możesz przekazać polecenie {"50256": -100} , aby zapobiec wygenerowaniu tokenu <|endoftext|> .
No None
logprobs liczba całkowita Uwzględnij logarytmiczne prawdopodobieństwa dla logprobs najbardziej prawdopodobnych tokenów wyjściowych oraz wybranych tokenów. Na przykład jeśli logprobs wartość to 5, interfejs API zwraca listę 5 najbardziej prawdopodobnych tokenów. Interfejs API zawsze zwraca logprob token próbki, więc w odpowiedzi może być maksymalnie logprobs+1 elementów.

Maksymalna wartość parametru logprobs to 5.
No None
max_tokens liczba całkowita Maksymalna liczba tokenów, które można wygenerować w zakończeniu.

Liczba tokenów zapytania plus max_tokens nie może przekraczać długości kontekstu modelu.
No 16
n liczba całkowita Ile uzupełnień ma zostać wygenerowanych dla każdego polecenia.

Uwaga: ponieważ ten parametr generuje wiele uzupełnień, może szybko wyczerpać przydział tokenów. Należy ostrożnie używać i upewnić się, że masz odpowiednie ustawienia dla max_tokens i stop.
No 1
presence_penalty number Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy. No 0
monit ciąg lub tablica Polecenie do wygenerowania uzupełnień zakodowane jako ciąg, tablica ciągów, tablica tokenów lub tablica tablicy tokenów.

Należy pamiętać, że <|endoftext|> jest separatorem dokumentu, który model rozpoznaje podczas treningu, więc jeśli podpowiedź nie zostanie określona, model generuje tak, jakby od początku nowego dokumentu.
Yes
seed liczba całkowita Jeśli zostaną określone, nasz system dokłada wszelkich starań, aby próbkowanie deterministyczne sprawiało, że powtarzające się żądania z tymi samymi parametrami seed zwracają ten sam wynik.

Determinizm nie jest gwarantowany i należy odwołać się do parametru odpowiedzi system_fingerprint w celu monitorowania zmian na serwerze.
No
stop ciąg lub tablica Maksymalnie cztery sekwencje, w których interfejs API przestaje generować kolejne tokeny. Zwrócony tekst nie będzie zawierać sekwencji zatrzymania. No
odtwarzać strumieniowo boolean Czy należy przesyłać strumieniowo częściowy postęp. W przypadku ustawienia tokeny są wysyłane jako zdarzenia wysyłane tylko do serwera, gdy staną się dostępne, a strumień zostanie zakończony komunikatem data: [DONE] . Przykładowy kod języka Python.
No False
suffix ciąg Sufiks, który pojawia się po zakończeniu wstawionego tekstu.

Ten parametr jest obsługiwany tylko dla programu gpt-3.5-turbo-instruct.
No None
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawiają, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawiają, że są bardziej skoncentrowane i deterministyczne.

Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie.
No 1
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie.
No 1
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć.
No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json createCompletionResponse

Kod stanu: wartość domyślna

Opis: Usługa niedostępna

Content-Type Type Description
application/json errorResponse

Examples

Example

Tworzy uzupełnienie dla podanej podpowiedzi, parametrów i wybranego modelu.

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

{
 "prompt": [
  "tell me a joke about mango"
 ],
 "max_tokens": 32,
 "temperature": 1.0,
 "n": 1
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
    "created": 1686617332,
    "choices": [
      {
        "text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
        "index": 0,
        "finish_reason": "stop",
        "logprobs": null
      }
    ],
    "usage": {
      "completion_tokens": 20,
      "prompt_tokens": 6,
      "total_tokens": 26
    }
  }
}

Osadzanie — tworzenie

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

Uzyskaj wektorową reprezentację danych wejściowych, które mogą być łatwo używane przez modele i algorytmy uczenia maszynowego.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id ścieżka Yes ciąg Identyfikator wdrożenia wdrożonego modelu.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
dimensions liczba całkowita Liczba wymiarów, które powinny mieć wynikowe osadzanie danych wyjściowych. Obsługiwane tylko w text-embedding-3 modelach i nowszych. No
encoding_format ciąg Format, w jakim można zwrócić osadzenia. Może to być wartość float lub base64. Wartość domyślna to float. No
dane wejściowe ciąg lub tablica Tekst wejściowy do osadzenia, zakodowany jako ciąg lub tablica tokenów. Aby osadzić wiele danych wejściowych w jednym żądaniu, przekaż tablicę ciągów lub tablicę tablic tokenów. Dane wejściowe nie mogą przekraczać maksymalnych tokenów wejściowych dla modelu (8192 tokenów dla text-embedding-ada-002), nie mogą być pustymi ciągami, a każda tablica musi mieć 2048 wymiarów lub mniej. Yes
input_type ciąg typ wyszukiwania osadzania, którego chcesz użyć No
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json obiekt

Examples

Example

Zwróć wektory osadzeń dla danego zapytania.

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

{
 "input": [
  "this is a test"
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "data": [
      {
        "index": 0,
        "embedding": [
          -0.012838088,
          -0.007421397,
          -0.017617522,
          -0.028278312,
          -0.018666342,
          0.01737855,
          -0.01821495,
          -0.006950092,
          -0.009937238,
          -0.038580645,
          0.010674067,
          0.02412286,
          -0.013647936,
          0.013189907,
          0.0021125758,
          0.012406612,
          0.020790534,
          0.00074595667,
          0.008397198,
          -0.00535031,
          0.008968075,
          0.014351576,
          -0.014086051,
          0.015055214,
          -0.022211088,
          -0.025198232,
          0.0065186154,
          -0.036350243,
          0.009180495,
          -0.009698266,
          0.009446018,
          -0.008463579,
          -0.0020113448
        ]
      }
    ],
    "usage": {
      "prompt_tokens": 4,
      "total_tokens": 4
    }
  }
}

Ukończenie czatu — tworzenie

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

Tworzy uzupełnienie wiadomości na czacie

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id ścieżka Yes ciąg
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
audio obiekt Parametry dla danych wyjściowych dźwięku. Wymagane przy żądaniu wyjścia audio za użyciem modalities: ["audio"]. No
Format └─ wyliczenie Określa format dźwięku wyjściowego. Musi być jednym z wav, mp3, flac, opus lub pcm16.

Możliwe wartości: wav, , mp3flac, , opuspcm16
No
└─ głos wyliczenie Określa typ głosu. Obsługiwane głosy to alloy, echo, fable, onyx, nova i shimmer.

Możliwe wartości: alloy, , echofable, onyx, , novashimmer
No
data_sources macierz Wpisy konfiguracji dla rozszerzeń czatu usługi Azure OpenAI, które ich używają.
Ta dodatkowa specyfikacja jest zgodna tylko z usługą Azure OpenAI.
No
frequency_penalty number Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza.
No 0
function_call ciąg lub czatCompletionFunctionCallOption Przestarzałe na rzecz tool_choice.

Określa, która (jeśli istnieje) funkcja jest wywoływana przez model.
none oznacza, że model nie wywoła funkcji, a zamiast tego generuje komunikat.
auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem funkcji.
Określenie określonej funkcji za pośrednictwem {"name": "my_function"} wymusza wywołanie tej funkcji przez model.

none jest wartością domyślną, gdy nie ma żadnych funkcji. auto jest wartością domyślną, jeśli funkcje są obecne.
No
functions macierz Przestarzałe na rzecz tools.

Lista funkcji, dla których model może generować dane wejściowe JSON.
No
logit_bias obiekt Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu.

Akceptuje obiekt JSON mapujący tokeny (określone przez ich identyfikator tokenu w tokenizatorze) na skojarzoną wartość stronniczą z zakresu od -100 do 100. Matematycznie stronniczy jest dodawany do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu.
No None
logprobs boolean Czy zwracać logarytmiczne prawdopodobieństwa dla tokenów wyjściowych, czy nie. Jeśli true, zwraca logarytmiczne prawdopodobieństwa każdego tokenu wyjściowego zwróconego w content elementu message. No False
max_completion_tokens liczba całkowita Górna granica liczby tokenów, które można wygenerować na potrzeby ukończenia, w tym widoczne tokeny wyjściowe i tokeny rozumowania. No
max_tokens liczba całkowita Maksymalna liczba tokenów, które można wygenerować podczas kończenia czatu.

Łączna długość tokenów wejściowych i wygenerowanych tokenów jest ograniczona przez długość kontekstu modelu.
No
messages macierz Lista wiadomości składających się z konwersacji do tej pory. Przykładowy kod języka Python. Yes
metadane obiekt Tagi i wartości zdefiniowane przez dewelopera używane do filtrowania uzupełniania na pulpicie nawigacyjnym przechowywanych uzupełniania. No
modalities ChatCompletionModalities Typy danych wyjściowych, które mają być generowane przez model dla tego żądania.
Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną:

["text"]

Model gpt-4o-audio-preview może również służyć do generowania dźwięku. Aby zażądać, aby ten model wygenerował odpowiedzi tekstowe i audio, możesz użyć:

["text", "audio"]
No
n liczba całkowita Ile opcji ukończenia czatu ma być generowanych dla każdej wiadomości wejściowej. Opłaty będą naliczane na podstawie liczby wygenerowanych tokenów we wszystkich opcjach. Zachowaj n jako 1 aby zminimalizować koszty. No 1
parallel_tool_calls ParallelToolCalls Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. No True
przewidywanie PredictionContent Konfiguracja przewidywanych danych wyjściowych, która może znacznie poprawić czas odpowiedzi, gdy duże części odpowiedzi modelu są znane z wyprzedzeniem. Jest to najbardziej typowe w przypadku ponownego generowania pliku z tylko drobnymi zmianami w większości zawartości. No
presence_penalty number Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy.
No 0
reasoning_effort wyliczenie Tylko modele o1

Ogranicza nakład pracy na rozumowanie modeli rozumowania.

Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi.
Możliwe wartości: low, , mediumhigh
No
response_format ResponseFormatText lub ResponseFormatJsonObject lub ResponseFormatJsonSchema Obiekt określający format, który musi zostać wygenerowany przez model. Zgodny z GPT-4o, GPT-4o mini, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo nowszymi niż gpt-3.5-turbo-1106.

Ustawienie { "type": "json_schema", "json_schema": {...} } włącza dane wyjściowe ze strukturą, co gwarantuje zgodność modelu z podanym schematem JSON.

Ustawienie { "type": "json_object" } włącza tryb JSON, co gwarantuje, że komunikat generowany przez model jest poprawnym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
seed liczba całkowita Ta funkcja jest dostępna w wersji beta.
Jeśli zostaną określone, nasz system dokłada wszelkich starań, aby próbkowanie deterministyczne sprawiało, że powtarzające się żądania z tymi samymi parametrami seed zwracają ten sam wynik.
Determinizm nie jest gwarantowany i należy odwołać się do parametru odpowiedzi system_fingerprint w celu monitorowania zmian na serwerze.
No
stop ciąg lub tablica Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny.
No
przechowywać boolean Niezależnie od tego, czy dane wyjściowe tego żądania ukończenia czatu mają być używane w naszych produktach destylacyjnych lub ewaluacyjnych modelu. No
odtwarzać strumieniowo boolean Jeśli zostanie ustawione, wysyłane są częściowe różnice komunikatów, na przykład w ChatGPT. Tokeny są wysyłane jako zdarzenia wysyłane tylko do serwera w miarę data: [DONE] ich dostępności, a strumień jest przerywany przez komunikat. Przykładowy kod języka Python.
No False
stream_options chatCompletionStreamOptions Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true.
No None
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawiają, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawiają, że są bardziej skoncentrowane i deterministyczne.

Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie.
No 1
tool_choice chatCompletionToolChoiceOption Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model. none oznacza, że model nie wywoła żadnego narzędzia, a zamiast tego generuje komunikat. auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia. required oznacza, że model musi wywoływać co najmniej jedno narzędzie. Określenie określonego narzędzia za pośrednictwem {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model. none jest ustawieniem domyślnym, gdy żadne narzędzia nie są obecne. auto jest wartością domyślną, jeśli istnieją narzędzia. No
tools macierz Lista narzędzi, które model może wywołać. Obecnie tylko funkcje są obsługiwane jako narzędzie. Służy do udostępniania listy funkcji, dla których model może generować dane wejściowe JSON. Obsługiwane są maksymalnie 128 funkcji.
No
top_logprobs liczba całkowita Liczba całkowita z zakresu od 0 do 20 określająca liczbę najbardziej prawdopodobnych tokenów do zwrócenia na każdej pozycji, z których każdy ma skojarzone logarytmiczne prawdopodobieństwo. logprobs musi być ustawione na true, jeśli ten parametr jest używany. No
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie.
No 1
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć.
No
user_security_context userSecurityContext Kontekst zabezpieczeń użytkownika zawiera kilka parametrów opisujących samą aplikację sztucznej inteligencji oraz użytkownika końcowego, który wchodzi w interakcję z aplikacją sztucznej inteligencji. Te pola ułatwiają zespołom ds. operacji zabezpieczeń badanie i eliminowanie zdarzeń zabezpieczeń, zapewniając kompleksowe podejście do ochrony aplikacji sztucznej inteligencji. Dowiedz się więcej o ochronie aplikacji sztucznej inteligencji przy użyciu Microsoft Defender dla Chmury. No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json obiekt

Kod stanu: wartość domyślna

Opis: Usługa niedostępna

Content-Type Type Description
application/json errorResponse

Examples

Example

Tworzy uzupełnienie dla podanej podpowiedzi, parametrów i wybranego modelu.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "system",
   "content": "you are a helpful assistant that talks like a pirate"
  },
  {
   "role": "user",
   "content": "can you tell me how to care for a parrot?"
  }
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Tworzy uzupełnienie w oparciu o dane z Azure Search oraz zarządzaną tożsamość przypisaną przez system.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "authentication": {
     "type": "system_assigned_managed_identity"
    }
   }
  }
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Tworzy uzupełnianie na podstawie danych wektorów obrazów usługi Azure Search.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "query_type": "vector",
    "fields_mapping": {
     "image_vector_fields": [
      "image_vector"
     ]
    },
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    }
   }
  }
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion."
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Tworzy uzupełnianie na podstawie danych wektora usługi Azure Search, poprzedniego komunikatu asystenta i tożsamości zarządzanej przypisanej przez użytkownika.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a cat?"
  },
  {
   "role": "assistant",
   "content": "Content of the completion [doc1].",
   "context": {
    "intent": "cat care"
   }
  },
  {
   "role": "user",
   "content": "how about dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "authentication": {
     "type": "user_assigned_managed_identity",
     "managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
    },
    "index_name": "{index name}",
    "query_type": "vector",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "in_scope": true,
    "top_n_documents": 5,
    "strictness": 3,
    "role_information": "You are an AI assistant that helps people find information.",
    "fields_mapping": {
     "content_fields_separator": "\\n",
     "content_fields": [
      "content"
     ],
     "filepath_field": "filepath",
     "title_field": "title",
     "url_field": "url",
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content 2.",
                "title": "Citation Title 2",
                "filepath": "contoso2.txt",
                "url": "https://contoso.blob.windows.net/container/contoso2.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Tworzy ukończenie dla podanej usługi Azure Cosmos DB.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_cosmos_db",
   "parameters": {
    "authentication": {
     "type": "connection_string",
     "connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
    },
    "database_name": "vectordb",
    "container_name": "azuredocs",
    "index_name": "azuredocindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Tworzy ukończenie dla podanej bazy danych Mongo DB.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "mongo_db",
   "parameters": {
    "authentication": {
     "type": "username_and_password",
     "username": "<username>",
     "password": "<password>"
    },
    "endpoint": "<endpoint_name>",
    "app_name": "<application name>",
    "database_name": "sampledb",
    "collection_name": "samplecollection",
    "index_name": "sampleindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Tworzy ukończenie dla podanego programu Elasticsearch.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "elasticsearch",
   "parameters": {
    "endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
    "index_name": "{index name}",
    "authentication": {
     "type": "key_and_key_id",
     "key": "{key}",
     "key_id": "{key id}"
    }
   }
  }
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Tworzy ukończenie dla podanego zasobu Pinecone.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "pinecone",
   "parameters": {
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    },
    "environment": "{environment name}",
    "index_name": "{index name}",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "title_field": "title",
     "url_field": "url",
     "filepath_field": "filepath",
     "content_fields": [
      "content"
     ],
     "content_fields_separator": "\n"
    }
   }
  }
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Transkrypcje — tworzenie

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Transkrybuje dźwięk w języku wejściowym.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id ścieżka Yes ciąg
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: dane wielu części/formularzu

Name Typ Description Required Default
model ciąg Identyfikator modelu do użycia. Opcje to gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1, i gpt-4o-transcribe-diarize. Yes
plik ciąg Obiekt pliku audio do transkrypcji. Yes
język ciąg Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 zwiększa dokładność i opóźnienie. No
monit ciąg Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Komunikat powinien być zgodny z językiem dźwięku. No
response_format audioResponseFormat Definiuje format danych wyjściowych. No
temperature number Temperatura próbkowania z zakresu od 0 do 1. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Jeśli ustawiono wartość 0, model używa log prawdopodobieństwa, aby automatycznie zwiększyć temperaturę, aż do momentu, gdy przekroczy określone progi. No 0
timestamp_granularities[] macierz Stopień szczegółowości sygnatury czasowej do wypełnienia dla tej transkrypcji. response_format należy ustawić, verbose_json aby używać szczegółowości sygnatury czasowej. Obsługiwane są obie te opcje: word, lub segment. Uwaga: nie ma dodatkowego opóźnienia dla znaczników czasu segmentu, ale generowanie znaczników czasu dla wyrazów powoduje dodatkowe opóźnienie. No ['segment']

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json obiekt
text/plain ciąg Transkrybowany tekst w formacie wyjściowym (gdy response_format była jedną z wartości text, vtt lub srt).

Examples

Example

Pobiera transkrybowany tekst i powiązane metadane z dostarczonych danych dźwiękowych.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Pobiera transkrybowany tekst i powiązane metadane z dostarczonych danych dźwiękowych.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Odpowiedzi: Kod stanu: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Tłumaczenia — tworzenie

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

Transkrybuje i tłumaczy dźwięk wejściowy na tekst w języku angielskim.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id ścieżka Yes ciąg
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: dane wielu części/formularzu

Name Typ Description Required Default
plik ciąg Plik audio do tłumaczenia. Yes
monit ciąg Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Monit powinien być w języku angielskim. No
response_format audioResponseFormat Definiuje format danych wyjściowych. No
temperature number Temperatura próbkowania z zakresu od 0 do 1. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Jeśli ustawiono wartość 0, model używa log prawdopodobieństwa, aby automatycznie zwiększyć temperaturę, aż do momentu, gdy przekroczy określone progi. No 0

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json obiekt
text/plain ciąg Transkrypcja tekstu w formacie wyjściowym (gdy format_odpowiedzi był jednym z tekstu, vtt lub srt).

Examples

Example

Pobiera transkrybowany tekst w języku angielskim i skojarzone metadane z dostarczonych danych dźwiękowych mówionych.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Pobiera transkrybowany tekst w języku angielskim i skojarzone metadane z dostarczonych danych dźwiękowych mówionych.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Odpowiedzi: Kod stanu: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Mowa — tworzenie

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

Generuje dźwięk z tekstu wejściowego.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id ścieżka Yes ciąg
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: dane wielu części/formularzu

Name Typ Description Required Default
dane wejściowe ciąg Tekst do syntezowania dźwięku. Maksymalna długość to 4096 znaków. Yes
response_format wyliczenie Format syntetyzowania dźwięku.
Możliwe wartości: mp3, , opusaac, flac, , wavpcm
No
speed number Szybkość syntetyzowanego dźwięku. Wybierz wartość z 0.25 do 4.0. 1.0 jest wartością domyślną. No 1.0
voice wyliczenie Głos używany do syntezy mowy.
Możliwe wartości: alloy, , echofable, onyx, , novashimmer
Yes

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/octet-stream ciąg

Examples

Example

Syntetyzuje dźwięk z dostarczonego tekstu.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

Odpowiedzi: Kod stanu: 200

{
  "body": "101010101"
}

Generacje obrazów — tworzenie

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

Generuje zestaw obrazów na podstawie opisu tekstowego dla określonego wdrożenia modelu z serii DALL-E lub gpt-image-1

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id ścieżka Yes ciąg
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
tło imageBackground Umożliwia ustawienie przezroczystości tła wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1. No auto
n liczba całkowita Liczba obrazów do wygenerowania. Obsługiwane jest tylko n=1 dla dall-e-3. No 1
output_compression liczba całkowita Poziom kompresji (0–100%) dla wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1 z formatem danych wyjściowych jpeg. No 100
output_format imagesOutputFormat Format pliku, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko w przypadku modeli serii gpt-image-1. No png
monit ciąg Opis tekstu żądanych obrazów. Maksymalna długość to 32000 znaków dla serii gpt-image-1 i 4000 znaków dla dall-e-3 Yes
partial_images liczba całkowita Liczba częściowych obrazów do wygenerowania. Ten parametr jest używany do przesyłania strumieniowego odpowiedzi, które zwracają częściowe obrazy. Wartość musi należeć do przedziału od 0 do 3. Po ustawieniu wartości 0 odpowiedź będzie zawierać pojedynczy obraz wysłany w jednym zdarzeniu przesyłania strumieniowego. Należy pamiętać, że ostateczny obraz może zostać wysłany przed wygenerowaniem pełnej liczby obrazów częściowych, jeśli pełny obraz zostanie wygenerowany szybciej. 0
odtwarzać strumieniowo boolean Edytuj obraz w trybie przesyłania strumieniowego. no false
quality imageQuality Jakość obrazu, który zostanie wygenerowany. No auto
response_format imagesResponseFormat Format, w którym są zwracane wygenerowane obrazy. Ten parametr nie jest obsługiwany w przypadku gpt-image-1modeli serii , które zawsze będą zwracać obrazy zakodowane w formacie base64.
Możliwe wartości: url, b64_json.
No url
size imageSize Rozmiar wygenerowanych obrazów. No auto
styl imageStyle Styl wygenerowanych obrazów. Obsługiwane tylko dla dall-e-3. No vivid
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. No

Responses

Kod stanu: 200

Opis: Ok

Content-Type Type Description
application/json generateImagesResponse

Kod stanu: wartość domyślna

Opis: Wystąpił błąd.

Content-Type Type Description
application/json dalleErrorResponse

Examples

Example

Tworzy obrazy z monitem.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Generacje obrazów — edycja

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

Edytuje obraz z tekstowego podpisu w ramach danego wdrożenia modelu gpt-image-1

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id ścieżka Yes ciąg
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: dane wielu części/formularzu

Name Typ Description Required Default
obraz ciąg lub tablica Obrazy do edycji. Musi być obsługiwanym plikiem obrazu lub tablicą obrazów. Każdy obraz powinien być plikiem png lub jpg mniejszym niż 50 MB. Yes
input_fidelity ciąg Kontroluj, ile wysiłku model podejmie, aby dopasować styl i cechy, zwłaszcza cechy twarzy, obrazów wejściowych. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1. Obsługuje high i low. no low.
maska ciąg Dodatkowy obraz, którego w pełni przezroczyste obszary (np. alfa ma wartość zero) wskazują, gdzie ma być edytowany obraz. Jeśli dostępnych jest wiele obrazów, maska zostanie zastosowana do pierwszego obrazu. Musi być prawidłowym plikiem PNG, mniejszym niż 4 MB i mieć takie same wymiary jak obraz. No
n liczba całkowita Liczba obrazów do wygenerowania. Musi należeć do zakresu od 1 do 10. No 1
monit ciąg Opis tekstu żądanych obrazów. Maksymalna długość to 32000 znaków. Yes
quality imageQuality Jakość obrazu, który zostanie wygenerowany. No auto
partial_images Liczba częściowych obrazów do wygenerowania. Ten parametr jest używany do przesyłania strumieniowego odpowiedzi, które zwracają częściowe obrazy. Wartość musi należeć do przedziału od 0 do 3. Po ustawieniu wartości 0 odpowiedź będzie zawierać pojedynczy obraz wysłany w jednym zdarzeniu przesyłania strumieniowego. Należy pamiętać, że ostateczny obraz może zostać wysłany przed wygenerowaniem pełnej liczby obrazów częściowych, jeśli pełny obraz zostanie wygenerowany szybciej.
odtwarzać strumieniowo boolean Edytuj obraz w trybie przesyłania strumieniowego. no false
response_format imagesResponseFormat Format, w którym są zwracane wygenerowane obrazy. No url
size imageSize Rozmiar wygenerowanych obrazów. No auto
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. No

Responses

Kod stanu: 200

Opis: Ok

Content-Type Type Description
application/json generateImagesResponse

Kod stanu: wartość domyślna

Opis: Wystąpił błąd.

Content-Type Type Description
application/json dalleErrorResponse

Lista — Asystenci

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Zwraca listę asystentów.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
limit kwerenda No liczba całkowita Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20.
porządek kwerenda No ciąg
Możliwe wartości: asc, desc
Sortuj kolejność według znacznika created_at czasu obiektów. asc w przypadku kolejności rosnącej i desc kolejności malejącej.
after kwerenda No ciąg Kursor do użycia w stronicowaniu. after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy.
before kwerenda No ciąg Kursor do użycia w stronicowaniu. before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json listAssistantsResponse

Examples

Example

Zwraca listę asystentów.

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "asst_abc123",
        "object": "assistant",
        "created_at": 1707257477,
        "name": "Stock Analyst",
        "description": null,
        "model": "gpt-4-1106-preview",
        "instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc456",
        "object": "assistant",
        "created_at": 1698982718,
        "name": "My Assistant",
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": "You are a helpful assistant designed to make me better at coding!",
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc789",
        "object": "assistant",
        "created_at": 1698982643,
        "name": null,
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      }
    ],
    "first_id": "asst_abc123",
    "last_id": "asst_abc789",
    "has_more": false
  }
}

Tworzenie — Asystent

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Utwórz asystenta przy użyciu modelu i instrukcji.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
description ciąg Opis asystenta. Maksymalna długość to 512 znaków.
No
instructions ciąg Instrukcje systemowe używane przez asystenta. Maksymalna długość to 256 000 znaków.
No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
model ciąg Yes
name ciąg Nazwa asystenta. Maksymalna długość to 256 znaków.
No
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
No 1
tool_resources obiekt Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Magazyn wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta.
No
└─ przechowalnie_wektorów macierz Pomocnik do tworzenia magazynu wektorów z file_ids i dołączania go do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta.
No
tools macierz Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, retrievallub function.
No []
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu.
No 1

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json assistantObject

Examples

Example

Utwórz asystenta przy użyciu modelu i instrukcji.

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

{
 "name": "Math Tutor",
 "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
 "tools": [
  {
   "type": "code_interpreter"
  }
 ],
 "model": "gpt-4-1106-preview"
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant",
    "created_at": 1707295707,
    "name": "Math Tutor",
    "description": null,
    "model": "gpt-4-1106-preview",
    "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Pobierz — Asystent

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Pobiera asystenta.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
assistant_id ścieżka Yes ciąg Identyfikator asystenta do pobrania.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json assistantObject

Examples

Example

Pobiera asystenta.

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "asst_abc123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Modyfikowanie — Asystent

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Modyfikuje asystenta.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
assistant_id ścieżka Yes ciąg Identyfikator asystenta, który należy zmodyfikować.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
description ciąg Opis asystenta. Maksymalna długość to 512 znaków.
No
instructions ciąg Instrukcje systemowe używane przez asystenta. Maksymalna długość to 32768 znaków.
No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
model ciąg No
name ciąg Nazwa asystenta. Maksymalna długość to 256 znaków.
No
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
No 1
tool_resources obiekt Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Zastępuje listę identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Zastępuje magazyn wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta.
No
tools macierz Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, retrievallub function.
No []
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu.
No 1

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json assistantObject

Examples

Example

Modyfikuje asystenta.

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

{
 "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
 "tools": [
  {
   "type": "file_search"
  }
 ],
 "model": "gpt-4-turbo"
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "asst_123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": []
      }
    },
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Usuwanie — Asystent

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Usuń asystenta.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
assistant_id ścieżka Yes ciąg Identyfikator asystenta do usunięcia.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json deleteAssistantResponse

Examples

Example

Usuwa asystenta.

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant.deleted",
    "deleted": true
  }
}

Tworzenie — wątek

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

Utwórz wątek.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
messages macierz Lista komunikatów, z których chcesz rozpocząć wątek. No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
tool_resources obiekt Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku.
No
└─ przechowalnie_wektorów macierz Pomocnik do tworzenia magazynu wektorów z file_ids i dołączania go do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku.
No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json threadObject

Examples

Example

Tworzy wątek.

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {}
  }
}

Pobierz — wątek

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Pobiera wątek.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątku do pobrania.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json threadObject

Examples

Example

Pobiera wątek.

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {},
    "tool_resources": {
      "code_interpreter": {
        "file_ids": []
      }
    }
  }
}

Modyfikuj — wątek

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Modyfikuje wątek.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątku do zmodyfikowania. Można modyfikować tylko metadata.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
tool_resources obiekt Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku.
No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json threadObject

Examples

Example

Modyfikuje wątek.

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {
      "modified": "true",
      "user": "abc123"
    },
    "tool_resources": {}
  }
}

Usuwanie — wątek

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Usuń wątek.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątku do usunięcia.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json deleteThreadResponse

Examples

Example

Usuwa wątek.

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread.deleted",
    "deleted": true
  }
}

Lista — komunikaty

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Zwraca listę komunikatów dla danego wątku.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątków, do których należą komunikaty.
limit kwerenda No liczba całkowita Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20.
porządek kwerenda No ciąg
Możliwe wartości: asc, desc
Sortuj kolejność według znacznika created_at czasu obiektów. asc w przypadku kolejności rosnącej i desc kolejności malejącej.
after kwerenda No ciąg Kursor do użycia w stronicowaniu. after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy.
before kwerenda No ciąg Kursor do użycia w stronicowaniu. before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy.
run_id kwerenda No ciąg Filtruj komunikaty według identyfikatora przebiegu, który je wygenerował.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json listMessagesResponse

Examples

Example

Wyświetlanie listy komunikatów

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "msg_abc123",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "How does AI work? Explain it in simple terms.",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      },
      {
        "id": "msg_abc456",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "Hello, what is AI?",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      }
    ],
    "first_id": "msg_abc123",
    "last_id": "msg_abc456",
    "has_more": false
  }
}

Tworzenie — komunikat

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Utwórz wiadomość.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątków, dla których należy utworzyć wiadomość.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
attachments macierz Lista plików dołączonych do wiadomości oraz narzędzia, do których należy je dodać. No
zawartość ciąg Zawartość wiadomości. Yes
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
rola ciąg Rola jednostki tworzącej komunikat. Dozwolone wartości obejmują:
- user: wskazuje, że komunikat jest wysyłany przez rzeczywistego użytkownika i powinien być używany w większości przypadków do reprezentowania komunikatów generowanych przez użytkownika.
- assistant: wskazuje, że komunikat jest generowany przez asystenta. Użyj tej wartości, aby wstawić wiadomości z asystenta do konwersacji.
Yes

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json messageObject

Examples

Example

Utwórz wiadomość.

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

{
 "role": "user",
 "content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "assistant_id": null,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "attachments": [],
    "metadata": {}
  }
}

Pobierz — komunikat

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Pobieranie komunikatu.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątków, do których należy ten komunikat.
message_id ścieżka Yes ciąg Identyfikator wiadomości do pobrania.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json messageObject

Examples

Example

Pobieranie komunikatu.

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "assistant_id": null,
    "run_id": null,
    "metadata": {}
  }
}

Modyfikuj — komunikat

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Modyfikuje komunikat.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątku, do którego należy ten komunikat.
message_id ścieżka Yes ciąg Identyfikator wiadomości do zmodyfikowania.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json messageObject

Examples

Example

Zmodyfikuj komunikat.

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "msg_abc123",
    "object": "thread.message",
    "created_at": 1699017614,
    "assistant_id": null,
    "thread_id": "thread_abc123",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "How does AI work? Explain it in simple terms.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "metadata": {
      "modified": "true",
      "user": "abc123"
    }
  }
}

Tworzenie — wątek i uruchamianie

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

Utwórz wątek i uruchom go w jednym żądaniu.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
assistant_id ciąg Identyfikator asystenta do wykonania tego przebiegu. Yes
instructions ciąg Zastąpi domyślny komunikat systemowy asystenta. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. No
max_completion_tokens liczba całkowita Maksymalna liczba tokenów ukończenia, które mogą być używane w trakcie przebiegu. Uruchomienie dokłada wszelkich starań, aby używać tylko określonej liczby tokenów ukończenia w wielu etapach uruchomienia. Jeśli przebieg przekroczy określoną liczbę tokenów ukończenia, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details.
No
max_prompt_tokens liczba całkowita Maksymalna liczba tokenów monitów, które mogą być używane w trakcie przebiegu. Przebieg dokłada wszelkich starań, aby używać tylko określonej liczby tokenów monitu podczas wielu cykli przebiegu. Jeśli przebieg przekroczy określoną liczbę tokenów monitu, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details.
No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
model ciąg Identyfikator modeli, które mają być wykorzystane do wykonania tego zadania. Jeśli w tym miejscu zostanie podana wartość, zastąpi ona model skojarzony z asystentem. Jeśli nie, zostanie użyty model skojarzony z asystentem. No
parallel_tool_calls ParallelToolCalls Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. No True
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
odtwarzać strumieniowo boolean Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] .
No
stream_options chatCompletionStreamOptions Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true.
No None
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
No 1
konwersacja createThreadRequest No
tool_choice assistantsApiToolChoiceOption Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie wywołuje żadnych narzędzi, a zamiast tego generuje komunikat.
auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.
Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
No
tool_resources obiekt Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Identyfikator magazynu wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta.
No
tools macierz Zastąpić narzędzia, których asystent może użyć na potrzeby tego przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. No
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu.
No 1
truncation_strategy truncationObject Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json runObject

Examples

Example

Utwórz wątek i uruchom go w jednym żądaniu.

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123",
 "thread": {
  "messages": [
   {
    "role": "user",
    "content": "Explain deep learning to a 5 year old."
   }
  ]
 }
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076792,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": null,
    "expires_at": 1699077392,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "required_action": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You are a helpful assistant.",
    "tools": [],
    "tool_resources": {},
    "metadata": {},
    "temperature": 1.0,
    "top_p": 1.0,
    "max_completion_tokens": null,
    "max_prompt_tokens": null,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "incomplete_details": null,
    "usage": null,
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Lista — uruchomienia

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Zwraca listę przebiegów należących do wątku.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątku, do którego należy przebieg.
limit kwerenda No liczba całkowita Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20.
porządek kwerenda No ciąg
Możliwe wartości: asc, desc
Sortuj kolejność według znacznika created_at czasu obiektów. asc w przypadku kolejności rosnącej i desc kolejności malejącej.
after kwerenda No ciąg Kursor do użycia w stronicowaniu. after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy.
before kwerenda No ciąg Kursor do użycia w stronicowaniu. before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json listRunsResponse

Examples

Example

Zwraca listę przebiegów należących do wątku.

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "run_abc123",
        "object": "thread.run",
        "created_at": 1699075072,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699075072,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699075073,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      },
      {
        "id": "run_abc456",
        "object": "thread.run",
        "created_at": 1699063290,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699063290,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699063291,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      }
    ],
    "first_id": "run_abc123",
    "last_id": "run_abc456",
    "has_more": false
  }
}

Tworzenie — uruchamianie

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Utwórz przebieg.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątku do uruchomienia.
include[] kwerenda No macierz Lista dodatkowych pól do uwzględnienia w odpowiedzi. Obecnie jedyną obsługiwaną wartością jest step_details.tool_calls[*].file_search.results[*].content, aby pobrać zawartość wyników wyszukiwania pliku.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
additional_instructions ciąg Dołącza dodatkowe instrukcje na końcu instrukcji dotyczących przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów bez zastępowania innych instrukcji. No
additional_messages macierz Dodaje dodatkowe komunikaty do wątku przed utworzeniem przebiegu. No
assistant_id ciąg Identyfikator asystenta do wykonania tego przebiegu. Yes
instructions ciąg Zastąpi domyślny komunikat systemowy asystenta. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. No
max_completion_tokens liczba całkowita Maksymalna liczba tokenów ukończenia, które mogą być używane w trakcie przebiegu. Uruchomienie dokłada wszelkich starań, aby używać tylko określonej liczby tokenów ukończenia w wielu etapach uruchomienia. Jeśli przebieg przekroczy określoną liczbę tokenów ukończenia, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details.
No
max_prompt_tokens liczba całkowita Maksymalna liczba tokenów monitów, które mogą być używane w trakcie przebiegu. Przebieg dokłada wszelkich starań, aby używać tylko określonej liczby tokenów monitu podczas wielu cykli przebiegu. Jeśli przebieg przekroczy określoną liczbę tokenów monitu, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details.
No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
model ciąg Identyfikator modelu, który ma być używany do wykonania tego przebiegu. Jeśli w tym miejscu zostanie podana wartość, zastąpi ona model skojarzony z asystentem. Jeśli nie, zostanie użyty model skojarzony z asystentem. No
parallel_tool_calls ParallelToolCalls Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. No True
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
odtwarzać strumieniowo boolean Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] .
No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
No 1
tool_choice assistantsApiToolChoiceOption Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie wywołuje żadnych narzędzi, a zamiast tego generuje komunikat.
auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.
Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
No
tools macierz Zastąpić narzędzia, których asystent może użyć na potrzeby tego przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. No
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu.
No 1
truncation_strategy truncationObject Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json runObject

Examples

Example

Utwórz przebieg.

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123"
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699063290,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": 1699063290,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699063291,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Pobierz — uruchamianie

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Pobiera przebieg.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator uruchomionych wątków.
run_id ścieżka Yes ciąg Identyfikator przebiegu do pobrania.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json runObject

Examples

Example

Pobiera przebieg.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
    "object": "thread.run",
    "created_at": 1707303196,
    "assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
    "thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
    "status": "completed",
    "started_at": 1707303197,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1707303201,
    "last_error": null,
    "model": "gpt-4-1106-preview",
    "instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
    "tools": [],
    "file_ids": [],
    "metadata": {}
  }
}

Modyfikowanie — uruchamianie

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Modyfikuje przebieg.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator uruchomionych wątków.
run_id ścieżka Yes ciąg Identyfikator uruchomienia do zmodyfikowania.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json runObject

Examples

Example

Modyfikuje przebieg.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "user_id": "user_abc123"
 }
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699075072,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "completed",
    "started_at": 1699075072,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699075073,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "tool_resources": {
      "code_interpreter": {
        "file_ids": [
          "file-abc123",
          "file-abc456"
        ]
      }
    },
    "metadata": {
      "user_id": "user_abc123"
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    },
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Przesyłanie — dane wyjściowe narzędzia do uruchomienia

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

Gdy przebieg ma status: "requires_action" wartość i required_action.type to submit_tool_outputs, ten punkt końcowy może służyć do przesyłania danych wyjściowych z wywołań narzędzia po ich zakończeniu. Wszystkie dane wyjściowe muszą zostać przesłane w jednym żądaniu.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątków, do których należy to uruchomienie.
run_id ścieżka Yes ciąg Identyfikator przebiegu, który wymaga przesłania raportu z działania narzędzia.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
odtwarzać strumieniowo boolean Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] .
No
tool_outputs macierz Lista narzędzi, dla których są przesyłane dane wyjściowe. Yes

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json runObject

Examples

Example

Gdy przebieg ma status: "requires_action" wartość i required_action.type to submit_tool_outputs, ten punkt końcowy może służyć do przesyłania danych wyjściowych z wywołań narzędzia po ich zakończeniu. Wszystkie dane wyjściowe muszą zostać przesłane w jednym żądaniu.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

{
 "tool_outputs": [
  {
   "tool_call_id": "call_001",
   "output": "70 degrees and sunny."
  }
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "run_123",
    "object": "thread.run",
    "created_at": 1699075592,
    "assistant_id": "asst_123",
    "thread_id": "thread_123",
    "status": "queued",
    "started_at": 1699075592,
    "expires_at": 1699076192,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "tools": [
      {
        "type": "function",
        "function": {
          "name": "get_current_weather",
          "description": "Get the current weather in a given location",
          "parameters": {
            "type": "object",
            "properties": {
              "location": {
                "type": "string",
                "description": "The city and state, e.g. San Francisco, CA"
              },
              "unit": {
                "type": "string",
                "enum": [
                  "celsius",
                  "fahrenheit"
                ]
              }
            },
            "required": [
              "location"
            ]
          }
        }
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Anulowanie — uruchamianie

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

Anuluje przebieg, który ma wartość in_progress.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątku, do którego należy to uruchomienie.
run_id ścieżka Yes ciąg Identyfikator uruchomienia do anulowania.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json runObject

Examples

Example

Anuluje przebieg, który ma wartość in_progress.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076126,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "cancelling",
    "started_at": 1699076126,
    "expires_at": 1699076726,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You summarize books.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": [
          "vs_123"
        ]
      }
    },
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "response_format": "auto"
  }
}

Lista — kroki uruchamiania

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

Zwraca listę kroków uruchamiania należących do przebiegu.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątku, do którego należy uruchomienie i kroki uruchamiania.
run_id ścieżka Yes ciąg Identyfikator przebiegu, do którego należą kroki uruchamiania.
limit kwerenda No liczba całkowita Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20.
porządek kwerenda No ciąg
Możliwe wartości: asc, desc
Sortuj kolejność według znacznika created_at czasu obiektów. asc w przypadku kolejności rosnącej i desc kolejności malejącej.
after kwerenda No ciąg Kursor do użycia w stronicowaniu. after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy.
before kwerenda No ciąg Kursor do użycia w stronicowaniu. before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy.
api-version kwerenda Yes ciąg
include[] kwerenda No macierz Lista dodatkowych pól do uwzględnienia w odpowiedzi. Obecnie jedyną obsługiwaną wartością jest step_details.tool_calls[*].file_search.results[*].content, aby pobrać zawartość wyników wyszukiwania pliku.

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json listRunStepsResponse

Examples

Example

Zwraca listę kroków uruchamiania należących do przebiegu.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "step_abc123",
        "object": "thread.run.step",
        "created_at": 1699063291,
        "run_id": "run_abc123",
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "type": "message_creation",
        "status": "completed",
        "cancelled_at": null,
        "completed_at": 1699063291,
        "expired_at": null,
        "failed_at": null,
        "last_error": null,
        "step_details": {
          "type": "message_creation",
          "message_creation": {
            "message_id": "msg_abc123"
          }
        },
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        }
      }
    ],
    "first_id": "step_abc123",
    "last_id": "step_abc456",
    "has_more": false
  }
}

Pobieranie — krok uruchamiania

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

Pobiera krok uruchomienia.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
thread_id ścieżka Yes ciąg Identyfikator wątku, do którego należy uruchomienie i krok uruchomienia.
run_id ścieżka Yes ciąg Identyfikator przebiegu, do którego należy krok uruchamiania.
step_id ścieżka Yes ciąg Identyfikator etapu procesu do pobrania.
include[] kwerenda No macierz Lista dodatkowych pól do uwzględnienia w odpowiedzi. Obecnie jedyną obsługiwaną wartością jest step_details.tool_calls[*].file_search.results[*].content, aby pobrać zawartość wyników wyszukiwania pliku.
api-version kwerenda Yes ciąg

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json runStepObject

Examples

Example

Pobiera krok uruchomienia.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "step_abc123",
    "object": "thread.run.step",
    "created_at": 1699063291,
    "run_id": "run_abc123",
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "type": "message_creation",
    "status": "completed",
    "cancelled_at": null,
    "completed_at": 1699063291,
    "expired_at": null,
    "failed_at": null,
    "last_error": null,
    "step_details": {
      "type": "message_creation",
      "message_creation": {
        "message_id": "msg_abc123"
      }
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    }
  }
}

Lista — magazyny wektorowe

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Zwraca listę magazynów wektorów.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
limit kwerenda No liczba całkowita Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20.
porządek kwerenda No ciąg
Możliwe wartości: asc, desc
Sortuj kolejność według znacznika created_at czasu obiektów. asc w przypadku kolejności rosnącej i desc kolejności malejącej.
after kwerenda No ciąg Kursor do użycia w stronicowaniu. after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy.
before kwerenda No ciąg Kursor do użycia w stronicowaniu. before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json listVectorStoresResponse

Examples

Example

Zwraca listę magazynów wektorów.

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "vs_abc123",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      },
      {
        "id": "vs_abc456",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ v2",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      }
    ],
    "first_id": "vs_abc123",
    "last_id": "vs_abc456",
    "has_more": false
  }
}

Tworzenie — magazyn wektorów

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Utwórz magazyn wektorów.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
chunking_strategy autoChunkingStrategyRequestParam lub staticChunkingStrategyRequestParam Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. Dotyczy tylko wtedy, gdy file_ids nie jest pusty. No
expires_after vectorStoreExpirationAfter Zasady wygasania magazynu wektorów. No
file_ids macierz Lista identyfikatorów plików, których powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
name ciąg Nazwa magazynu wektorów. No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json vectorStoreObject

Examples

Example

Tworzy magazyn wektorów.

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

Pobieranie — magazyn wektorów

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Pobiera magazyn wektorów.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów do pobrania.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json vectorStoreObject

Examples

Example

Pobiera magazyn wektorów.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776
  }
}

Modyfikuj — magazyn wektorów

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Modyfikuje magazyn wektorów.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów do zmodyfikowania.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
expires_after vectorStoreExpirationAfter Zasady wygasania magazynu wektorów. No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
name ciąg Nazwa magazynu wektorów. No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json vectorStoreObject

Examples

Example

Modyfikuje magazyn wektorów.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

{
 "name": "Support FAQ"
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

Usuwanie — magazyn wektorów

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Usuń magazyn wektorów.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów do usunięcia.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json deleteVectorStoreResponse

Examples

Example

Usuwa magazyn wektorów.

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store.deleted",
    "deleted": true
  }
}

Lista — pliki magazynu wektorowego

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Zwraca listę plików magazynu wektorowego.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów, do którego należą pliki.
limit kwerenda No liczba całkowita Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20.
porządek kwerenda No ciąg
Możliwe wartości: asc, desc
Sortuj kolejność według znacznika created_at czasu obiektów. asc w przypadku kolejności rosnącej i desc kolejności malejącej.
after kwerenda No ciąg Kursor do użycia w stronicowaniu. after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy.
before kwerenda No ciąg Kursor do użycia w stronicowaniu. before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy.
filtr kwerenda No ciąg
Możliwe wartości: in_progress, , completed, failedcancelled
Filtruj według stanu pliku. Jeden z in_progress, completed, failed, cancelled.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json listVectorStoreFilesResponse

Examples

Example

Zwraca listę plików magazynu wektorowego.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

Tworzenie — plik magazynu wektorów

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Utwórz plik magazynu wektorów, dołączając plik do magazynu wektorów.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów, dla którego ma zostać utworzony plik.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
chunking_strategy chunkingStrategyRequestParam Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. No
file_id ciąg Identyfikator pliku, którego powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. Yes

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json vectorStoreFileObject

Examples

Example

Utwórz plik magazynu wektorów, dołączając plik do magazynu wektorów.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

{
 "file_id": "file-abc123"
}

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "usage_bytes": 1234,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

Get — plik magazynu wektorów

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Pobiera plik magazynu wektorów.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów, do którego należy plik.
file_id ścieżka Yes ciąg Identyfikator pobieranego pliku.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json vectorStoreFileObject

Examples

Example

Pobiera plik magazynu wektorów.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

Usuwanie — plik magazynu wektorowego

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Usuń plik magazynu wektorów. Spowoduje to usunięcie pliku z magazynu wektorów, ale sam plik nie zostanie usunięty. Aby usunąć plik, użyj punktu końcowego usuwania pliku.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów, do którego należy plik.
file_id ścieżka Yes ciąg Identyfikator pliku do usunięcia.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json deleteVectorStoreFileResponse

Examples

Example

Usuń plik magazynu wektorów. Spowoduje to usunięcie pliku z magazynu wektorów, ale sam plik nie zostanie usunięty. Aby usunąć plik, użyj punktu końcowego usuwania pliku.

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "file_abc123",
    "object": "vector_store.file.deleted",
    "deleted": true
  }
}

Updatevectorstorefileattributes

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Zaktualizuj atrybuty w pliku wektorowym.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów, do którego należy plik.
file_id ścieżka Yes ciąg Identyfikator pliku do zaktualizowania atrybutów.

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
attributes VectorStoreFileAttributes Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości logiczne lub liczby.
Yes

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json vectorStoreFileObject

Pobierz zawartość pliku magazynu wektorów

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}/content?api-version=2025-04-01-preview

Pobierz przeanalizowaną zawartość pliku repozytorium wektorów.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów.
file_id ścieżka Yes ciąg ID pliku w magazynie wektorów.

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json VectorStoreFileContentResponse

Repozytorium wektorów wyszukiwania

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/search?api-version=2025-04-01-preview

Przeszukaj magazyn wektorów pod kątem odpowiednich fragmentów na podstawie filtru atrybutów zapytania i pliku.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów do wyszukiwania.

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
filters Filtr porównawczy lub filtr złożony Filtr do zastosowania na podstawie atrybutów pliku. No
max_num_results liczba całkowita Maksymalna liczba wyników do zwrócenia. Ta liczba powinna należeć do zakresu od 1 do 50 włącznie. No 10
kwerenda ciąg lub tablica Ciąg zapytania dla wyszukiwania Yes
ranking_options obiekt Opcje klasyfikacji wyszukiwania. No
└} ranker wyliczenie
Możliwe wartości: auto, default-2024-11-15
No
└─ próg_punktowy number No 0
rewrite_query boolean Określa, czy należy ponownie napisać zapytanie języka naturalnego na potrzeby wyszukiwania wektorów. No False

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json VectorStoreSearchResultsPage

Tworzenie — wektorowa partia plików magazynu

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

Utwórz wektorową partię plików magazynu.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów, dla którego ma zostać utworzona partia plików.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
chunking_strategy chunkingStrategyRequestParam Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. No
file_ids macierz Lista identyfikatorów plików, których powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. Yes

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json vectorStoreFileBatchObject

Examples

Example

Utwórz wektorową partię plików magazynu.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

{
 "file_ids": [
  "file-abc123",
  "file-abc456"
 ]
}

Odpowiedzi: Kod stanu: 200

{
  "id": "vsfb_abc123",
  "object": "vector_store.file_batch",
  "created_at": 1699061776,
  "vector_store_id": "vs_abc123",
  "status": "in_progress",
  "file_counts": {
    "in_progress": 1,
    "completed": 1,
    "failed": 0,
    "cancelled": 0,
    "total": 0
  }
}

Get — wektorowa partia plików magazynu

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

Pobiera wektorową partię plików magazynu.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów, do którego należy partia plików.
batch_id ścieżka Yes ciąg Identyfikator pobieranej partii plików.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json vectorStoreFileBatchObject

Examples

Example

Pobiera wektorową partię plików magazynu.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "in_progress",
    "file_counts": {
      "in_progress": 1,
      "completed": 1,
      "failed": 0,
      "cancelled": 0,
      "total": 0
    }
  }
}

Anulowanie — wektorowy magazyn plików wsadowy

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

Anuluj partię plików magazynu wektorów. Spowoduje to jak najszybsze anulowanie przetwarzania plików w tej partii.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów, do którego należy partia plików.
batch_id ścieżka Yes ciąg Identyfikator partii plików, którą należy anulować.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json vectorStoreFileBatchObject

Examples

Example

Anuluj partię plików magazynu wektorów. Spowoduje to jak najszybsze anulowanie przetwarzania plików w tej partii.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "cancelling",
    "file_counts": {
      "in_progress": 12,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 15
    }
  }
}

Lista — pliki wsadowe magazynu wektorów

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

Zwraca listę plików magazynu wektorów w partii.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
vector_store_id ścieżka Yes ciąg Identyfikator magazynu wektorów, do którego należą pliki.
batch_id ścieżka Yes ciąg Identyfikator partii plików, do którego należą pliki.
limit kwerenda No liczba całkowita Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20.
porządek kwerenda No ciąg
Możliwe wartości: asc, desc
Sortuj kolejność według znacznika created_at czasu obiektów. asc w przypadku kolejności rosnącej i desc kolejności malejącej.
after kwerenda No ciąg Kursor do użycia w stronicowaniu. after jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, kończąc się obj_foo, kolejne wywołanie może obejmować polecenie after=obj_foo w celu pobrania następnej strony listy.
before kwerenda No ciąg Kursor do użycia w stronicowaniu. before jest identyfikatorem obiektu definiującym miejsce na liście. Jeśli na przykład wykonasz żądanie listy i otrzymasz 100 obiektów, począwszy od obj_foo, kolejne wywołanie może zawierać wartość before=obj_foo w celu pobrania poprzedniej strony listy.
filtr kwerenda No ciąg
Możliwe wartości: in_progress, , completed, failedcancelled
Filtruj według stanu pliku. Jeden z in_progress, completed, failed, cancelled.
api-version kwerenda Yes ciąg wersja interfejsu API

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json listVectorStoreFilesResponse

Examples

Example

Zwraca listę plików magazynu wektorowego.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

Odpowiedzi: Kod stanu: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

Tworzenie — Realtimesession

POST https://{endpoint}/openai/realtimeapi/sessions?api-version=2025-04-01-preview

Utwórz tymczasowy token API do użycia na stronie klienta korzystając z API w czasie rzeczywistym. Można skonfigurować z takimi samymi parametrami sesji, co zdarzenie klienta session.update. Odpowiada obiektem sesji oraz kluczem client_secret, który zawiera tymczasowy token API, umożliwiający uwierzytelnianie klientów przeglądarki w interfejsie API czasu rzeczywistego.

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
input_audio_format wyliczenie Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.
W przypadku pcm16 dźwięk wejściowy musi być w formacie 16-bitowego PCM z częstotliwością próbkowania 24 kHz, z pojedynczym kanałem (mono) i w kolejności bajtów małobitowej.

Możliwe wartości: pcm16, , g711_ulawg711_alaw
No
input_audio_noise_reduction obiekt Konfiguracja redukcji szumu dźwięku wejściowego. Można to ustawić tak, null aby wyłączyć.
Filtry redukcji szumów przetwarzają dźwięk dodany do wejściowego bufora audio, zanim zostanie on wysłany do usługi VAD i modelu.
Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i zmian (zmniejszając liczbę fałszywie dodatnich wyników) oraz poprawić wydajność modelu poprzez polepszenie postrzegania dźwięku wejściowego.
No
└typ wyliczenie Typ redukcji szumu. near_field jest przeznaczony dla mikrofonów kierunkowych, takich jak te w słuchawkach, podczas gdy far_field jest przeznaczony dla mikrofonów dalekiego pola, takich jak te w laptopie lub w salach konferencyjnych.

Możliwe wartości: near_field, far_field
No
input_audio_transcription obiekt Konfiguracja transkrypcji dźwięku wejściowego, domyślnie wyłączona i może być ustawiona na null, aby wyłączyć po włączeniu. Transkrypcja audio wejściowego nie jest natywna dla modelu, ponieważ model korzysta bezpośrednio z dźwięku. Transkrypcja jest uruchamiana asynchronicznie za pośrednictwem punktu końcowego transkrypcji i powinna być traktowana jako wskazówki dotyczące wejściowej zawartości audio, a nie dokładnie tego, co usłyszał model. Klient ma możliwość ustawienia języka oraz wybrania opcji monitowania o transkrypcję, co zapewnia dodatkowe wskazówki dla usługi transkrypcyjnej.
No
└* język ciąg Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie.
No
Model └* ciąg Model używany do transkrypcji, bieżące opcje to gpt-4o-transcribe, , gpt-4o-transcribe-diarizegpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15i whisper-1.
No
Zachęta └* ciąg Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio.
W przypadku whisper-1 polecenie to lista słów kluczowych.
W przypadku gpt-4o-transcribe modeli instrukcja jest wolnym ciągiem tekstowym, na przykład "oczekuj słów związanych z technologią".
No
instructions ciąg Domyślne instrukcje systemowe (tj. komunikat systemowy) są poprzedzane wywołaniami modelu. To pole umożliwia klientowi kierowanie odpowiedziami modelu w pożądany sposób. Model może być poinstruowany na temat zawartości i formatu odpowiedzi (np. "być bardzo zwięzły", "działać przyjazny", "oto przykłady dobrych odpowiedzi") i zachowania audio (np. "szybko rozmawiać", "wstrzykiwanie emocji do głosu", "śmiać się często"). Instrukcje nie gwarantują, że będą przestrzegane przez model, ale zapewniają przewodnictwo dotyczące pożądanego zachowania modelu.

Należy pamiętać, że serwer ustawia domyślne instrukcje, które będą używane, jeśli to pole nie jest ustawione i są widoczne w session.created zdarzeniu na początku sesji.
No
max_response_output_tokens liczba całkowita lub ciąg Maksymalna liczba tokenów wyjściowych dla pojedynczej odpowiedzi asystenta, w tym wywołań narzędzi. Podaj liczbę całkowitą z zakresu od 1 do 4096, aby ograniczyć liczbę tokenów wyjściowych, lub użyj inf dla maksymalnej liczby dostępnych tokenów dla danego modelu. Wartość domyślna to inf.
No
modalities Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"].
No
model ciąg Nazwa wdrożenia używanego na potrzeby tej sesji.
No
output_audio_format wyliczenie Format dźwięku wyjściowego. Opcje to pcm16, g711_ulawlub g711_alaw.
W przypadku pcm16parametru dźwięk wyjściowy jest próbkowany z szybkością 24kHz.

Możliwe wartości: pcm16, , g711_ulawg711_alaw
No
temperature number Temperatura próbkowania dla modelu ograniczona do [0.6, 1.2]. W przypadku modeli audio temperatura 0,8 jest zdecydowanie zalecana w celu uzyskania najlepszej wydajności.
No 0.8
tool_choice ciąg W jaki sposób model wybiera narzędzia. Opcje to auto, none, requiredlub określają funkcję.
No auto
tools macierz Narzędzia (funkcje) dostępne dla modelu. No
turn_detection obiekt Konfiguracja wykrywania zmian, albo Server VAD lub Semantic VAD. Można ustawić to na null aby wyłączyć, co spowoduje, że klient będzie musiał ręcznie wyzwolić odpowiedź modelu.
Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika.
Semantyczna funkcja VAD jest bardziej zaawansowana i używa modelu wykrywania zmiany mówcy (w połączeniu z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie określa limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika zacznie zanikać uhhm, model oceni niskie prawdopodobieństwo zakończenia wypowiedzi i poczeka dłużej na to, aby użytkownik kontynuował mowę. Może to być przydatne w przypadku bardziej naturalnych rozmów, ale może mieć większe opóźnienie.
No
└create_response boolean Określenie, czy odpowiedź powinna być automatycznie generowana po wystąpieniu zdarzenia zatrzymania VAD.
No True
└* gotowość wyliczenie Używane tylko w semantic_vad trybie. Gotowość modelu do reagowania. low będzie czekać dłużej, aż użytkownik będzie nadal mówić, high będzie reagować szybciej. auto jest wartością domyślną i jest odpowiednikiem medium.

Możliwe wartości: low, , medium, highauto
No
└reakcja_na_przerwanie boolean Określa, czy automatycznie przerywać bieżącą odpowiedź na rzecz wyjścia do domyślnej konwersacji (tj. conversation) po wystąpieniu zdarzenia rozpoczęcia VAD (tj. auto).
No True
└─prefix_padding_ms liczba całkowita Używane tylko w server_vad trybie. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms.
No
└czas_trwania_ciszy_ms liczba całkowita Używane tylko w server_vad trybie. Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika.
No
└* próg number Używane tylko w server_vad trybie. Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach.
No
└typ wyliczenie Typ wykrywania zakrętów.

Możliwe wartości: server_vad, semantic_vad
No
voice VoiceIdsShared No

Responses

Kod stanu: 200

Opis: Sesja została pomyślnie utworzona.

Content-Type Type Description
application/json RealtimeSessionCreateResponse

Utwórz — Transkrypcja sesji w czasie rzeczywistym

POST https://{endpoint}/openai/realtimeapi/transcription_sessions?api-version=2025-04-01-preview

Utwórz tymczasowy token API do używania w aplikacjach klienckich z API czasu rzeczywistego dedykowanym transkrypcjom w czasie rzeczywistym. Można skonfigurować z takimi samymi parametrami sesji, co zdarzenie klienta transcription_session.update. Odpowiada obiektem sesji oraz kluczem client_secret, który zawiera tymczasowy token API, umożliwiający uwierzytelnianie klientów przeglądarki w interfejsie API czasu rzeczywistego.

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
include macierz Zestaw elementów do uwzględnienia w transkrypcji. Bieżące dostępne elementy to:
- item.input_audio_transcription.logprobs
No
input_audio_format wyliczenie Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.
W przypadku pcm16 dźwięk wejściowy musi być w formacie 16-bitowego PCM z częstotliwością próbkowania 24 kHz, z pojedynczym kanałem (mono) i w kolejności bajtów małobitowej.

Możliwe wartości: pcm16, , g711_ulawg711_alaw
No
input_audio_noise_reduction obiekt Konfiguracja redukcji szumu dźwięku wejściowego. Można to ustawić tak, null aby wyłączyć.
Filtry redukcji szumów przetwarzają dźwięk dodany do wejściowego bufora audio, zanim zostanie on wysłany do usługi VAD i modelu.
Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i zmian (zmniejszając liczbę fałszywie dodatnich wyników) oraz poprawić wydajność modelu poprzez polepszenie postrzegania dźwięku wejściowego.
No
└typ wyliczenie Typ redukcji szumu. near_field jest przeznaczony dla mikrofonów kierunkowych, takich jak te w słuchawkach, podczas gdy far_field jest przeznaczony dla mikrofonów dalekiego pola, takich jak te w laptopie lub w salach konferencyjnych.

Możliwe wartości: near_field, far_field
No
input_audio_transcription obiekt Konfiguracja transkrypcji dźwięku wejściowego. Klient ma możliwość ustawienia języka oraz wybrania opcji monitowania o transkrypcję, co zapewnia dodatkowe wskazówki dla usługi transkrypcyjnej.
No
└* język ciąg Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie.
No
Model └* wyliczenie Model używany do transkrypcji, bieżące opcje to gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15i whisper-1.

Możliwe wartości: gpt-4o-transcribe, , gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15whisper-1
No
Zachęta └* ciąg Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio.
W przypadku whisper-1 polecenie to lista słów kluczowych.
W przypadku gpt-4o-transcribe modeli instrukcja jest wolnym ciągiem tekstowym, na przykład "oczekuj słów związanych z technologią".
No
modalities Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"].
No
turn_detection obiekt Konfiguracja wykrywania zmian, albo Server VAD lub Semantic VAD. Można ustawić to na null aby wyłączyć, co spowoduje, że klient będzie musiał ręcznie wyzwolić odpowiedź modelu.
Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika.
Semantyczna funkcja VAD jest bardziej zaawansowana i używa modelu wykrywania zmiany mówcy (w połączeniu z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie określa limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika zacznie zanikać uhhm, model oceni niskie prawdopodobieństwo zakończenia wypowiedzi i poczeka dłużej na to, aby użytkownik kontynuował mowę. Może to być przydatne w przypadku bardziej naturalnych rozmów, ale może mieć większe opóźnienie.
No
└create_response boolean Określenie, czy odpowiedź powinna być automatycznie generowana po wystąpieniu zdarzenia zatrzymania VAD. Niedostępne dla sesji transkrypcji.
No True
└* gotowość wyliczenie Używane tylko w semantic_vad trybie. Gotowość modelu do reagowania. low będzie czekać dłużej, aż użytkownik będzie nadal mówić, high będzie reagować szybciej. auto jest wartością domyślną i jest odpowiednikiem medium.

Możliwe wartości: low, , medium, highauto
No
└reakcja_na_przerwanie boolean Określa, czy automatycznie przerywać bieżącą odpowiedź na rzecz wyjścia do domyślnej konwersacji (tj. conversation) po wystąpieniu zdarzenia rozpoczęcia VAD (tj. auto). Niedostępne dla sesji transkrypcji.
No True
└─prefix_padding_ms liczba całkowita Używane tylko w server_vad trybie. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms.
No
└czas_trwania_ciszy_ms liczba całkowita Używane tylko w server_vad trybie. Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika.
No
└* próg number Używane tylko w server_vad trybie. Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach.
No
└typ wyliczenie Typ wykrywania zakrętów.

Możliwe wartości: server_vad, semantic_vad
No

Responses

Kod stanu: 200

Opis: Sesja została pomyślnie utworzona.

Content-Type Type Description
application/json RealtimeTranscriptionSessionCreateResponse

Responses

POST https://{endpoint}/openai/responses?api-version=2025-04-01-preview

Tworzy odpowiedź modelu.

Treść żądania

Typ zawartości: aplikacja/json

Name Typ Description Required Default
include macierz No
dane wejściowe ciąg lub tablica Dane wejściowe modelu Yes
instructions ciąg Wstawia komunikat systemu (lub dewelopera) jako pierwszy element w kontekście modelu.

Podczas używania previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia proste wymienianie komunikatów systemowych lub komunikatów od deweloperów w nowych odpowiedziach.
No
max_output_tokens liczba całkowita Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widoczne tokeny wyjściowe i stan konwersacji.
No
parallel_tool_calls boolean Czy zezwolić modelowi na równoległe uruchamianie wywołań narzędzi.
No True
previous_response_id ciąg Unikatowy identyfikator poprzedniej odpowiedzi na model. Użyj tego, aby utworzyć wielokrotne konwersacje. Dowiedz się więcej o stanie konwersacji.
No
reasoning Reasoning Opcje konfiguracji dla modeli rozumowania. No
przechowywać boolean Określa, czy przechowywać wygenerowaną odpowiedź modelu na potrzeby późniejszego pobierania za pośrednictwem interfejsu API.
No True
odtwarzać strumieniowo boolean W przypadku ustawienia wartości true dane odpowiedzi modelu będą przesyłane strumieniowo do klienta, ponieważ są generowane przy użyciu zdarzeń wysyłanych przez serwer.
Aby uzyskać więcej informacji, zobacz sekcję Przesyłanie strumieniowe poniżej.
No False
SMS obiekt Opcje konfiguracji generowania odpowiedzi tekstowej przez model. Może to być zwykły tekst lub dane JSON ze strukturą. Więcej informacji:
- Wprowadzanie tekstu i dane wyjściowe
- Ustrukturyzowane wyniki
No
Format └─ TextResponseFormatConfiguration Obiekt określający format, który musi zostać wygenerowany przez model.

Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, co zapewnia, że model jest zgodny ze podanym schematem JSON.

Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.

Niezalecane w przypadku modeli gpt-4o i nowszych:

Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują.
No
tool_choice ToolChoiceOptions lub ToolChoiceTypes lub ToolChoiceFunction W jaki sposób model powinien wybrać narzędzie (lub narzędzia), które ma być używane podczas generowania odpowiedzi. Zobacz parametr , tools aby zobaczyć, jak określić narzędzia, które może wywołać model.
No
tools macierz Tablica narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając tool_choice parametr .

Dwie kategorie narzędzi, które można modelowi podać, to:

- Wbudowane narzędzia: narzędzia dostarczane przez firmę OpenAI, które rozszerzają
możliwości modelu
No
truncation wyliczenie Strategia obcinania, która ma być użyta dla odpowiedzi modelu.
- auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstu modelu, model obcina odpowiedź, aby dopasować okno kontekstu, upuszczając elementy wejściowe w środku konwersacji.
- disabled (ustawienie domyślne): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstu dla modelu, żądanie zakończy się niepowodzeniem z powodu błędu 400.

Możliwe wartości: auto, disabled
No

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json response
text/event-stream responseStreamEvent

Kod stanu: wartość domyślna

Opis: Usługa niedostępna

Content-Type Type Description
application/json errorResponse

Interfejs API odpowiedzi — elementy wejściowe

GET https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

Pobiera odpowiedź modelu z danym identyfikatorem.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
response_id ścieżka Yes ciąg Identyfikator odpowiedzi do pobrania.
include kwerenda No macierz Dodatkowe pola do uwzględnienia w odpowiedzi. include Aby uzyskać więcej informacji, zobacz parametr tworzenia odpowiedzi powyżej.

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json response

Kod stanu: wartość domyślna

Opis: Usługa niedostępna

Content-Type Type Description
application/json errorResponse

Usuń odpowiedź

DELETE https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

Usuwa odpowiedź modelu z danym identyfikatorem.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
response_id ścieżka Yes ciąg Identyfikator odpowiedzi do usunięcia.

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Kod stanu: 404

Opis: Nie znaleziono

Content-Type Type Description
application/json error

Kod stanu: wartość domyślna

Opis: Usługa niedostępna

Content-Type Type Description
application/json errorResponse

Interfejs API odpowiedzi — lista elementów odpowiedzi

GET https://{endpoint}/openai/responses/{response_id}/input_items?api-version=2025-04-01-preview

Zwraca listę elementów wejściowych dla danej odpowiedzi.

Parametry identyfikatora URI

Name In Required Typ Description
punkt końcowy ścieżka Yes ciąg znaków URL Obsługiwane punkty końcowe usługi Azure OpenAI (protokół i nazwa hosta, np. "https://aoairesource.openai.azure.com". Zastąp ciąg "aoairesource" nazwą zasobu Azure OpenAI). https://{your-resource-name}.openai.azure.com
response_id ścieżka Yes ciąg Identyfikator odpowiedzi, dla której należy pobrać elementy wejściowe.
limit kwerenda No liczba całkowita Limit liczby zwracanych obiektów. Limit może mieścić się w zakresie od 1 do 100, a wartość domyślna to 20.
porządek kwerenda No ciąg
Możliwe wartości: asc, desc
Kolejność przywracania elementów wejściowych. Wartość domyślna to asc.
- asc: Zwraca elementy wejściowe w kolejności rosnącej.
- desc: Zwraca elementy wejściowe w kolejności malejącej.
after kwerenda No ciąg Identyfikator elementu, po którym wyświetlane są kolejne elementy na liście, używany w stronicowaniu.
before kwerenda No ciąg Identyfikator elementu do wyświetlania listy elementów wcześniej używany w stronicowaniu.

Nagłówek żądania

Użyj uwierzytelniania opartego na tokenach lub klucza interfejsu API. Uwierzytelnianie przy użyciu uwierzytelniania opartego na tokenach jest zalecane i bezpieczniejsze.

Name Required Typ Description
Authorization True ciąg Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Aby wygenerować token uwierzytelniania przy użyciu interfejsu wiersza polecenia platformy Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
zakres: https://cognitiveservices.azure.com/.default
api-key True ciąg Tutaj podaj klucz interfejsu API usługi Azure OpenAI

Responses

Kod stanu: 200

Opis: OK

Content-Type Type Description
application/json responseItemList

Components

errorResponse

Name Typ Description Required Default
błąd error No

errorBase

Name Typ Description Required Default
kod ciąg No
komunikat ciąg No

błąd

Name Typ Description Required Default
inner_error innerError Wewnętrzny błąd z dodatkowymi szczegółami. No
param ciąg No
typ ciąg No

innerError

Wewnętrzny błąd z dodatkowymi szczegółami.

Name Typ Description Required Default
kod innerErrorCode Kody błędów dla obiektu błędu wewnętrznego. No
content_filter_results contentFilterPromptResults Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator. No

innerErrorCode

Kody błędów dla obiektu błędu wewnętrznego.

Property Value
Description Kody błędów dla obiektu błędu wewnętrznego.
Type ciąg
Values ResponsibleAIPolicyViolation

dalleErrorResponse

Name Typ Description Required Default
błąd dalleError No

dalleError

Name Typ Description Required Default
inner_error dalleInnerError Wewnętrzny błąd z dodatkowymi szczegółami. No
param ciąg No
typ ciąg No

dalleInnerError

Wewnętrzny błąd z dodatkowymi szczegółami.

Name Typ Description Required Default
kod innerErrorCode Kody błędów dla obiektu błędu wewnętrznego. No
content_filter_results dalleFilterResults Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator. No
revised_prompt ciąg Polecenie, które zostało użyte do wygenerowania obrazu, jeśli dokonano jakiejkolwiek poprawki do podpowiedzi. No

contentFilterCompletionTextSpan

Opisuje zakres w wygenerowanym tekście uzupełniania. Przesunięcie 0 jest pierwszym punktem kodu UTF32 tekstu ukończenia.

Name Typ Description Required Default
completion_end_offset liczba całkowita Przesunięcie pierwszego punktu kodu UTF32, który jest wykluczony z zakresu. To pole jest zawsze równe completion_start_offset dla pustych zakresów. To pole jest zawsze większe niż completion_start_offset w przypadku niepustych zakresów. Yes
completion_start_offset liczba całkowita Przesunięcie punktu kodu UTF32, który rozpoczyna zakres. Yes

contentFilterResultBase

Name Typ Description Required Default
filtered boolean Yes

contentFilterSeverityResult

Name Typ Description Required Default
filtered boolean Yes
severity ciąg No

contentFilterDetectedResult

Name Typ Description Required Default
detected boolean No
filtered boolean Yes

contentFilterDetectedWithCitationResult

Name Typ Description Required Default
citation obiekt No
└* adres URL ciąg No
└─ Licencja ciąg No

contentFilterDetectedWithCompletionTextSpansResult

Name Typ Description Required Default
details macierz No

contentFilterIdResult

Name Typ Description Required Default
filtered boolean Yes
id ciąg No

contentFilterResultsBase

Informacje o wynikach filtrowania zawartości.

Name Typ Description Required Default
custom_blocklists contentFilterDetailedResults Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów. No
błąd errorBase No
hate contentFilterSeverityResult No
profanity contentFilterDetectedResult No
self_harm contentFilterSeverityResult No
sexual contentFilterSeverityResult No
violence contentFilterSeverityResult No

contentFilterPromptResults

Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator.

Name Typ Description Required Default
custom_blocklists contentFilterDetailedResults Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów. No
błąd errorBase No
hate contentFilterSeverityResult No
indirect_attack contentFilterDetectedResult No
jailbreak contentFilterDetectedResult No
profanity contentFilterDetectedResult No
self_harm contentFilterSeverityResult No
sexual contentFilterSeverityResult No
violence contentFilterSeverityResult No

contentFilterChoiceResults

Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o tekście pochodzącym od podmiotów trzecich oraz o wulgaryzmach, czy zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator.

Name Typ Description Required Default
custom_blocklists contentFilterDetailedResults Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów. No
błąd errorBase No
hate contentFilterSeverityResult No
profanity contentFilterDetectedResult No
protected_material_code contentFilterDetectedWithCitationResult No
protected_material_text contentFilterDetectedResult No
self_harm contentFilterSeverityResult No
sexual contentFilterSeverityResult No
ungrounded_material contentFilterDetectedWithCompletionTextSpansResult No
violence contentFilterSeverityResult No

contentFilterDetailedResults

Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów.

Name Typ Description Required Default
details macierz No
filtered boolean Yes

promptFilterResult

Wyniki filtrowania treści dla pojedynczego polecenia w żądaniu.

Name Typ Description Required Default
content_filter_results contentFilterPromptResults Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator. No
prompt_index liczba całkowita No

promptFilterResults

Wyniki filtrowania zawartości dla zera lub większej liczby monitów w żądaniu. W żądaniu przesyłania strumieniowego wyniki dla różnych poleceń mogą pojawiać się o różnych porach lub w różnej kolejności.

Brak zdefiniowanych właściwości dla tego składnika.

dalleContentFilterResults

Informacje o wynikach filtrowania zawartości.

Name Typ Description Required Default
hate contentFilterSeverityResult No
self_harm contentFilterSeverityResult No
sexual contentFilterSeverityResult No
violence contentFilterSeverityResult No

dalleFilterResults

Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator.

Name Typ Description Required Default
custom_blocklists contentFilterDetailedResults Wyniki filtrowania zawartości ze szczegółowymi identyfikatorami filtrów zawartości dla filtrowanych segmentów. No
hate contentFilterSeverityResult No
jailbreak contentFilterDetectedResult No
profanity contentFilterDetectedResult No
self_harm contentFilterSeverityResult No
sexual contentFilterSeverityResult No
violence contentFilterSeverityResult No

chatCompletionsRequestCommon

Name Typ Description Required Default
frequency_penalty number Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza. No 0
logit_bias obiekt Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu. Akceptuje obiekt JSON mapujący tokeny (określone przez ich identyfikator tokenu w tokenizatorze) na skojarzzoną wartość stronniczą z -100 do 100. Matematycznie, przesunięcie jest dodawane do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu. No
max_completion_tokens liczba całkowita Górna granica liczby tokenów, które można wygenerować na potrzeby ukończenia, w tym widoczne tokeny wyjściowe i tokeny rozumowania. No
max_tokens liczba całkowita Maksymalna liczba tokenów dozwolonych dla wygenerowanej odpowiedzi. Domyślnie liczba tokenów, które model może zwrócić, wynosi (4096 - tokeny podpowiedzi). Nie jest to zgodne z modelami serii o1. No 4096
metadane obiekt Tagi i wartości zdefiniowane przez dewelopera używane do filtrowania uzupełniania na pulpicie nawigacyjnym przechowywanych uzupełniania. No
presence_penalty number Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy. No 0
stop ciąg lub tablica Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny. No
przechowywać boolean Niezależnie od tego, czy dane wyjściowe tego żądania ukończenia czatu mają być używane w naszych produktach destylacyjnych lub ewaluacyjnych modelu. No
odtwarzać strumieniowo boolean Jeśli zostanie ustawione, wysyłane są częściowe różnice komunikatów, na przykład w ChatGPT. Tokeny są wysyłane jako zdarzenia wysyłane z serwera zawierające tylko dane, gdy stają się dostępne, a strumień jest przerywany komunikatem data: [DONE]. No False
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie.
No 1
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.
Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie.
No 1
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc usłudze Azure OpenAI w monitorowaniu i wykrywaniu nadużyć. No

createCompletionRequest

Name Typ Description Required Default
best_of liczba całkowita Generuje uzupełnienia best_of po stronie serwera i zwraca najlepszą (tę z najwyższym logarytmicznym prawdopodobieństwem na token). Nie można przesyłać strumieniowo wyników.

W przypadku użycia z n, best_of kontroluje liczbę potencjalnych kandydatów do zakończenia, a n określa, ile z nich należy zwrócić. best_of wartość musi być większa niż n.

Uwaga: ponieważ ten parametr generuje wiele uzupełnień, może szybko wyczerpać przydział tokenów. Należy ostrożnie używać i upewnić się, że masz odpowiednie ustawienia dla max_tokens i stop.
No 1
echo boolean Powtórz ponownie monit oprócz ukończenia
No False
frequency_penalty number Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza.
No 0
logit_bias obiekt Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu.

Akceptuje obiekt JSON, który mapuje tokeny (określone przez ich identyfikator tokenu w tokenizatorze GPT) do odpowiadającej wartości uprzedzenia od -100 do 100. Matematycznie, przesunięcie jest dodawane do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu.

Na przykład możesz przekazać polecenie {"50256": -100} , aby zapobiec wygenerowaniu tokenu <|endoftext|> .
No None
logprobs liczba całkowita Uwzględnij logarytmiczne prawdopodobieństwa dla logprobs najbardziej prawdopodobnych tokenów wyjściowych oraz wybranych tokenów. Na przykład jeśli logprobs ma wartość 5, interfejs API zwróci listę 5 najbardziej prawdopodobnych tokenów. Interfejs API zawsze zwraca logprob próbkowanego tokenu, więc w odpowiedzi może być maksymalnie logprobs+1 elementów.

Maksymalna wartość parametru logprobs to 5.
No None
max_tokens liczba całkowita Maksymalna liczba tokenów, które można wygenerować w zakończeniu.

Liczba tokenów zapytania plus max_tokens nie może przekraczać długości kontekstu modelu.
No 16
n liczba całkowita Ile uzupełnień ma zostać wygenerowanych dla każdego polecenia.

Uwaga: ponieważ ten parametr generuje wiele uzupełnień, może szybko wyczerpać przydział tokenów. Należy ostrożnie używać i upewnić się, że masz odpowiednie ustawienia dla max_tokens i stop.
No 1
presence_penalty number Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy.
No 0
monit ciąg lub tablica Monity do generowania uzupełnień, zakodowane jako ciąg znaków, tablica ciągów znaków, tablica tokenów lub tablica tablic tokenów.

Należy pamiętać, że <|endoftext|> jest separatorem dokumentu, który widzi model podczas trenowania, więc jeśli monit nie zostanie określony, model zostanie wygenerowany tak, jakby od początku nowego dokumentu.
Yes
seed liczba całkowita Jeśli zostaną określone, nasz system dokłada wszelkich starań, aby próbkowanie deterministyczne sprawiało, że powtarzające się żądania z tymi samymi parametrami seed zwracają ten sam wynik.

Determinizm nie jest gwarantowany i należy odwołać się do parametru odpowiedzi system_fingerprint w celu monitorowania zmian na serwerze.
No
stop ciąg lub tablica Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny. Zwrócony tekst nie będzie zawierać sekwencji zatrzymania.
No
odtwarzać strumieniowo boolean Czy należy przesyłać strumieniowo częściowy postęp. W przypadku ustawienia tokeny są wysyłane jako zdarzenia wysyłane tylko do serwera, gdy staną się dostępne, a strumień zostanie zakończony komunikatem data: [DONE] . Przykładowy kod języka Python.
No False
suffix ciąg Sufiks, który pojawia się po zakończeniu wstawionego tekstu.

Ten parametr jest obsługiwany tylko dla programu gpt-3.5-turbo-instruct.
No None
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.

Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie.
No 1
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie.
No 1
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć.
No

createCompletionResponse

Reprezentuje odpowiedź końcową z interfejsu API. Uwaga: zarówno przesyłane strumieniowo, jak i nie przesyłane strumieniowo obiekty odpowiedzi mają ten sam kształt (w przeciwieństwie do punktu końcowego czatu).

Name Typ Description Required Default
choices macierz Lista opcji uzupełniania, które model wygenerował dla promptu wejściowego. Yes
created liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) czasu utworzenia ukończenia. Yes
id ciąg Unikalny identyfikator ukończenia. Yes
model ciąg Model używany do ukończenia. Yes
obiekt wyliczenie Typ obiektu, który jest zawsze „ukończenie_tekstu”
Możliwe wartości: text_completion
Yes
prompt_filter_results promptFilterResults Wyniki filtrowania zawartości dla zera lub większej liczby monitów w żądaniu. W żądaniu przesyłania strumieniowego wyniki dla różnych poleceń mogą pojawiać się o różnych porach lub w różnej kolejności. No
system_fingerprint ciąg Ten odcisk palca reprezentuje zaplecze systemowe, z którym działa model.

Można użyć w połączeniu z parametrem żądania seed, aby zrozumieć, kiedy wprowadzono zmiany w back-endzie, które mogą wpływać na deterministyczne działanie.
No
użycie completionUsage Statystyki użycia dotyczące żądania zakończenia. No

createChatCompletionRequest

Name Typ Description Required Default
audio obiekt Parametry dla danych wyjściowych dźwięku. Wymagane przy żądaniu wyjścia audio za użyciem modalities: ["audio"]. No
Format └─ wyliczenie Określa format dźwięku wyjściowego. Musi być jednym z wav, mp3, flac, opus lub pcm16.

Możliwe wartości: wav, , mp3flac, , opuspcm16
No
└─ głos wyliczenie Określa typ głosu. Obsługiwane głosy to alloy, echo, fable, onyx, nova i shimmer.

Możliwe wartości: alloy, , echofable, onyx, , novashimmer
No
data_sources macierz Wpisy konfiguracji dla rozszerzeń czatu usługi Azure OpenAI, które ich używają.
Ta dodatkowa specyfikacja jest zgodna tylko z usługą Azure OpenAI.
No
frequency_penalty number Liczba z zakresu od -2.0 do 2.0. Wartości dodatnie karzeją nowe tokeny na podstawie ich istniejącej częstotliwości w tekście do tej pory, zmniejszając prawdopodobieństwo powtórzeń tego samego wiersza.
No 0
function_call ciąg lub czatCompletionFunctionCallOption Przestarzałe na rzecz tool_choice.

Określa, która (jeśli istnieje) funkcja jest wywoływana przez model.
none oznacza, że model nie wywoła funkcji, a zamiast tego generuje komunikat.
auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem funkcji.
Określenie określonej funkcji za pośrednictwem {"name": "my_function"} wymusza wywołanie tej funkcji przez model.

none jest wartością domyślną, gdy nie ma żadnych funkcji. auto jest wartością domyślną, jeśli funkcje są obecne.
No
functions macierz Przestarzałe na rzecz tools.

Lista funkcji, dla których model może generować dane wejściowe JSON.
No
logit_bias obiekt Zmodyfikuj prawdopodobieństwo wyświetlania określonych tokenów w zakończeniu.

Akceptuje obiekt JSON mapujący tokeny (określone przez ich identyfikator tokenu w tokenizatorze) na skojarzoną wartość stronniczą z zakresu od -100 do 100. Matematycznie, przesunięcie jest dodawane do logitów wygenerowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości z zakresu od -1 do 1 powinny zmniejszyć lub zwiększyć prawdopodobieństwo wyboru; wartości takie jak -100 lub 100 powinny spowodować zakaz lub wyłączny wybór odpowiedniego tokenu.
No None
logprobs boolean Czy zwracać logarytmiczne prawdopodobieństwa dla tokenów wyjściowych, czy nie. Jeśli true, zwraca logarytmiczne prawdopodobieństwa każdego tokenu wyjściowego zwróconego w content elementu message. No False
max_completion_tokens liczba całkowita Górna granica liczby tokenów, które można wygenerować na potrzeby ukończenia, w tym widoczne tokeny wyjściowe i tokeny rozumowania. No
max_tokens liczba całkowita Maksymalna liczba tokenów, które można wygenerować podczas kończenia czatu.

Łączna długość tokenów wejściowych i wygenerowanych tokenów jest ograniczona przez długość kontekstu modelu.
No
messages macierz Lista wiadomości składających się z konwersacji do tej pory. Przykładowy kod języka Python. Yes
metadane obiekt Tagi i wartości zdefiniowane przez dewelopera używane do filtrowania uzupełniania na pulpicie nawigacyjnym przechowywanych uzupełniania. No
modalities ChatCompletionModalities Typy danych wyjściowych, które mają być generowane przez model dla tego żądania.
Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną:

["text"]

Model gpt-4o-audio-preview może również służyć do generowania dźwięku. Aby zażądać, aby ten model wygenerował odpowiedzi tekstowe i audio, możesz użyć:

["text", "audio"]
No
n liczba całkowita Ile opcji ukończenia czatu ma być generowanych dla każdej wiadomości wejściowej. Pamiętaj, że opłaty będą naliczane na podstawie liczby wygenerowanych tokenów we wszystkich opcjach. Zachowaj n jako 1 aby zminimalizować koszty. No 1
parallel_tool_calls ParallelToolCalls Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. No True
przewidywanie PredictionContent Konfiguracja przewidywanych danych wyjściowych, która może znacznie poprawić czas odpowiedzi, gdy duże części odpowiedzi modelu są znane z wyprzedzeniem. Jest to najbardziej typowe w przypadku ponownego generowania pliku z tylko drobnymi zmianami w większości zawartości. No
presence_penalty number Liczba z zakresu od -2.0 do 2.0. Dodatnie wartości nakładają karę na nowe tokeny na podstawie tego, czy pojawiają się one w tekście do tej pory, zwiększając prawdopodobieństwo, że model zacznie poruszać nowe tematy.
No 0
reasoning_effort wyliczenie Tylko modele o1

Ogranicza nakład pracy na rozumowanie modeli rozumowania.

Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi.
Możliwe wartości: low, , mediumhigh
No
response_format ResponseFormatText lub ResponseFormatJsonObject lub ResponseFormatJsonSchema Obiekt określający format, który musi zostać wygenerowany przez model. Zgodny z GPT-4o, GPT-4o mini, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo nowszymi niż gpt-3.5-turbo-1106.

Ustawienie parametru na { "type": "json_schema", "json_schema": {...} } włącza Dane Wyjściowe ze Strukturą, które zapewniają zgodność modelu z podanym schematem JSON.

Ustawienie { "type": "json_object" } włącza tryb JSON, co gwarantuje, że komunikat generowany przez model jest poprawnym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
seed liczba całkowita Ta funkcja jest dostępna w wersji beta.
Jeśli zostaną określone, nasz system dokłada wszelkich starań, aby próbkowanie deterministyczne sprawiało, że powtarzające się żądania z tymi samymi parametrami seed zwracają ten sam wynik.
Determinizm nie jest gwarantowany i należy odwołać się do parametru odpowiedzi system_fingerprint w celu monitorowania zmian na serwerze.
No
stop ciąg lub tablica Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny.
No
przechowywać boolean Niezależnie od tego, czy dane wyjściowe tego żądania ukończenia czatu mają być używane w naszych produktach destylacyjnych lub ewaluacyjnych modelu. No
odtwarzać strumieniowo boolean Jeśli zostanie ustawione, wysyłane są częściowe różnice komunikatów, na przykład w ChatGPT. Tokeny są wysyłane jako zdarzenia wysyłane tylko do serwera w miarę data: [DONE] ich dostępności, a strumień jest przerywany przez komunikat. Przykładowy kod języka Python.
No False
stream_options chatCompletionStreamOptions Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true.
No None
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.

Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie.
No 1
tool_choice chatCompletionToolChoiceOption Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model. none oznacza, że model nie wywoła żadnego narzędzia i zamiast tego generuje komunikat. auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia. required oznacza, że model musi wywoływać co najmniej jedno narzędzie. Określenie określonego narzędzia za pośrednictwem {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model. none jest ustawieniem domyślnym, gdy żadne narzędzia nie są obecne. auto jest wartością domyślną, jeśli istnieją narzędzia. No
tools macierz Lista narzędzi, które model może wywołać. Obecnie tylko funkcje są obsługiwane jako narzędzie. Służy do udostępniania listy funkcji, dla których model może generować dane wejściowe JSON. Obsługiwane są maksymalnie 128 funkcji.
No
top_logprobs liczba całkowita Liczba całkowita z zakresu od 0 do 20 określająca liczbę najbardziej prawdopodobnych tokenów do zwrócenia na każdej pozycji, z których każdy ma skojarzone logarytmiczne prawdopodobieństwo. logprobs musi być ustawione na true, jeśli ten parametr jest używany. No
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie.
No 1
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć.
No
user_security_context userSecurityContext Kontekst zabezpieczeń użytkownika zawiera kilka parametrów opisujących samą aplikację sztucznej inteligencji oraz użytkownika końcowego, który wchodzi w interakcję z aplikacją sztucznej inteligencji. Te pola ułatwiają zespołom ds. operacji zabezpieczeń badanie i eliminowanie zdarzeń zabezpieczeń, zapewniając kompleksowe podejście do ochrony aplikacji sztucznej inteligencji. Dowiedz się więcej o ochronie aplikacji sztucznej inteligencji przy użyciu Microsoft Defender dla Chmury. No

userSecurityContext

Kontekst zabezpieczeń użytkownika zawiera kilka parametrów opisujących samą aplikację sztucznej inteligencji oraz użytkownika końcowego, który wchodzi w interakcję z aplikacją sztucznej inteligencji. Te pola ułatwiają zespołom ds. operacji zabezpieczeń badanie i eliminowanie zdarzeń zabezpieczeń, zapewniając kompleksowe podejście do ochrony aplikacji sztucznej inteligencji. Dowiedz się więcej o ochronie aplikacji sztucznej inteligencji przy użyciu Microsoft Defender dla Chmury.

Name Typ Description Required Default
application_name ciąg Nazwa aplikacji. Poufne dane osobowe nie powinny być uwzględniane w tym polu. No
end_user_id ciąg Ten identyfikator jest identyfikatorem obiektu użytkownika Entra ID firmy Microsoft (dawniej Azure Active Directory) używanym do uwierzytelniania użytkowników końcowych w aplikacji generującej sztuczną inteligencję. Poufne dane osobowe nie powinny być uwzględniane w tym polu. No
end_user_tenant_id ciąg Identyfikator dzierżawy platformy Microsoft 365, do którego należy użytkownik końcowy. Jest to wymagane, gdy aplikacja generacyjna sztucznej inteligencji jest wielodostępna. No
source_ip ciąg Przechwytuje adres IP oryginalnego klienta, akceptując zarówno formatY IPv4, jak i IPv6. No

chatCompletionFunctions

Name Typ Description Required Default
description ciąg Opis działania funkcji używanej przez model do wyboru, kiedy i jak wywołać funkcję. No
name ciąg Nazwa funkcji do wywołania. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków. Yes
parameters FunctionParameters Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON. Zapoznaj się z przewodnikiem w celu poznania przykładów oraz z odniesieniem do schematu JSON dla dokumentacji dotyczącej formatu.

Pominięcie parameters definiuje funkcję z pustą listą parametrów.
No

chatCompletionFunctionCallOption

Określenie określonej funkcji za pośrednictwem {"name": "my_function"} wymusza wywołanie tej funkcji przez model.

Name Typ Description Required Default
name ciąg Nazwa funkcji do wywołania. Yes

chatCompletionFunctionParameters

Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON. Zapoznaj się z przewodnikiem/, aby zapoznać się z przykładami, oraz dokumentacją dotyczącą schematu JSON, aby uzyskać dokumentację dotyczącą formatu.

Brak zdefiniowanych właściwości dla tego składnika.

chatCompletionRequestMessage

Ten składnik może być jednym z następujących elementów:

ChatCompletionRequestDeveloperMessage

Instrukcje podane przez dewelopera, które powinny być zgodne z modelem, niezależnie od komunikatów wysyłanych przez użytkownika. W przypadku modeli o1 i nowszych developer komunikaty zastępują poprzednie system komunikaty.

Name Typ Description Required Default
zawartość ciąg lub tablica Zawartość komunikatu dla deweloperów. Yes
name ciąg Opcjonalna nazwa uczestnika. Zawiera informacje o modelu umożliwiające rozróżnienie między uczestnikami tej samej roli. No
rola wyliczenie Rola autora komunikatów, w tym przypadku developer.
Możliwe wartości: developer
Yes

chatCompletionRequestSystemMessage

Name Typ Description Required Default
zawartość ciąg lub tablica Zawartość komunikatu systemowego. Yes
name ciąg Opcjonalna nazwa uczestnika. Zawiera informacje o modelu umożliwiające rozróżnienie między uczestnikami tej samej roli. No
rola wyliczenie Rola autora komunikatów, w tym przypadku system.
Możliwe wartości: system
Yes

chatCompletionRequestUserMessage

Name Typ Description Required Default
zawartość ciąg lub tablica Zawartość wiadomości użytkownika.
Yes
name ciąg Opcjonalna nazwa uczestnika. Zawiera informacje o modelu umożliwiające rozróżnienie między uczestnikami tej samej roli. No
rola wyliczenie Rola autora komunikatów, w tym przypadku user.
Możliwe wartości: user
Yes

chatCompletionRequestAssistantMessage

Name Typ Description Required Default
zawartość ciąg lub tablica Zawartość komunikatu asystenta. Wymagane, chyba że określono tool_calls lub function_call.
No
function_call obiekt Przestarzałe i zastąpione przez tool_calls. Nazwa i argumenty funkcji, które powinny być wywoływane, generowane przez model. No
└─ Argumenty ciąg Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. No
└─ nazwa ciąg Nazwa funkcji do wywołania. No
name ciąg Opcjonalna nazwa uczestnika. Zawiera informacje o modelu umożliwiające rozróżnienie między uczestnikami tej samej roli. No
refusal ciąg Wiadomość o odmowie asystenta. No
rola wyliczenie Rola autora komunikatów, w tym przypadku assistant.
Możliwe wartości: assistant
Yes
tool_calls chatCompletionMessageToolCalls Wywołania narzędzi generowane przez model, takie jak wywołania funkcji. No

chatCompletionRequestToolMessage

Name Typ Description Required Default
zawartość ciąg lub tablica Zawartość komunikatu narzędzia. Yes
rola wyliczenie Rola autora komunikatów, w tym przypadku tool.
Możliwe wartości: tool
Yes
tool_call_id ciąg Wywołanie narzędzia, na które odpowiada ten komunikat. Yes

chatCompletionRequestFunctionMessage

Name Typ Description Required Default
zawartość ciąg Zawartość komunikatu funkcji. Yes
name ciąg Nazwa funkcji do wywołania. Yes
rola wyliczenie Rola autora komunikatów, w tym przypadku function.
Możliwe wartości: function
Yes

chatCompletionRequestDeveloperMessageContentPart

Ten składnik może być jednym z następujących elementów:

chatCompletionRequestSystemMessageContentPart

Ten składnik może być jednym z następujących elementów:

chatCompletionRequestUserMessageContentPart

Ten składnik może być jednym z następujących elementów:

chatCompletionRequestAssistantMessageContentPart

Ten składnik może być jednym z następujących elementów:

chatCompletionRequestToolMessageContentPart

Ten składnik może być jednym z następujących elementów:

chatCompletionRequestMessageContentPartText

Name Typ Description Required Default
SMS ciąg Zawartość tekstowa. Yes
typ wyliczenie Typ części zawartości.
Możliwe wartości: text
Yes

chatCompletionRequestMessageContentPartAudio

Name Typ Description Required Default
input_audio obiekt Yes
└─ dane ciąg Dane audio zakodowane w formacie Base64. No
Format └─ wyliczenie Format zakodowanych danych dźwiękowych. Obecnie obsługuje "wav" i "mp3".

Możliwe wartości: wav, mp3
No
typ wyliczenie Typ części zawartości. Zawsze input_audio.
Możliwe wartości: input_audio
Yes

chatCompletionRequestMessageContentPartImage

Name Typ Description Required Default
image_url obiekt Yes
└* szczegóły wyliczenie Określa poziom szczegółowości obrazu. Dowiedz się więcej w przewodniku Vision.
Możliwe wartości: auto, , lowhigh
No
└─ adres URL ciąg Adres URL obrazu lub zakodowane w formacie base64 dane obrazu. No
typ wyliczenie Typ części zawartości.
Możliwe wartości: image_url
Yes

chatCompletionRequestMessageContentPartRefusal

Name Typ Description Required Default
refusal ciąg Komunikat o odmowie wygenerowany przez model. Yes
typ wyliczenie Typ części zawartości.
Możliwe wartości: refusal
Yes

azureChatExtensionConfiguration

Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.

###Discriminator dla azureChatExtensionConfiguration

Ten składnik używa właściwości type do rozróżniania różnych typów:

Wartość typu Schema
azure_search azureSearchChatExtensionConfiguration
azure_cosmos_db azureCosmosDBChatExtensionConfiguration
elasticsearch elasticsearchChatExtensionConfiguration
mongo_db mongoDBChatExtensionConfiguration
pinecone pineconeChatExtensionConfiguration
Name Typ Description Required Default
typ azureChatExtensionType Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi.
Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.
Yes

azureChatExtensionType

Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi. Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.

Property Value
Description Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi.
Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.
Type ciąg
Values azure_search
azure_cosmos_db
elasticsearch
mongo_db
pinecone

azureSearchChatExtensionConfiguration

Konkretna reprezentacja konfigurowalnych opcji usługi Azure Search podczas korzystania z niej jako rozszerzenia czatu usługi Azure OpenAI.

Name Typ Description Required Default
parameters azureSearchChatExtensionParameters Parametry usługi Azure Search, gdy są używane jako rozszerzenie czatu usługi Azure OpenAI. No
typ azureChatExtensionType Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi.
Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.
Yes

azureSearchChatExtensionParameters

Parametry usługi Azure Search, gdy są używane jako rozszerzenie czatu usługi Azure OpenAI.

Name Typ Description Required Default
allow_partial_result boolean Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. No False
uwierzytelnianie onYourDataApiKeyAuthenticationOptions lub onYourDataSystemAssignedManagedIdentityAuthenticationOptions lub onYourDataUserAssignedManagedIdentityAuthenticationOptions lub onYourDataAccessTokenAuthenticationOptions Yes
embedding_dependency onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource lub onYourDataIntegratedVectorizationSource No
punkt końcowy ciąg Bezwzględna ścieżka punktu końcowego zasobu usługi Azure Search do użycia. Yes
fields_mapping azureSearchIndexFieldMappingOptions Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu usługi Azure Search. No
filtr ciąg Filtr wyszukiwania. No
in_scope boolean Czy zapytania powinny być ograniczone do używania indeksowanych danych. No
include_contexts macierz Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. No
index_name ciąg Nazwa indeksu, który ma być używany jako dostępny w przywoływowanym zasobie usługi Azure Search. Yes
max_search_queries liczba całkowita Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. No
query_type azureSearchQueryType Typ zapytania wyszukiwania w usłudze Azure Search, który należy wykonać podczas korzystania z niej jako rozszerzenia czatu w usłudze Azure OpenAI. No
semantic_configuration ciąg Dodatkowa konfiguracja semantyczna zapytania. No
strictness liczba całkowita Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. No
top_n_documents liczba całkowita Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. No

azureSearchIndexFieldMappingOptions

Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu usługi Azure Search.

Name Typ Description Required Default
content_fields macierz Nazwy pól indeksu, które powinny być traktowane jako zawartość. No
content_fields_separator ciąg Wzorzec separatora, którego powinny używać pola zawartości. No
filepath_field ciąg Nazwa pola indeksu do użycia jako ścieżka pliku. No
image_vector_fields macierz Nazwy pól reprezentujących dane wektorów obrazów. No
title_field ciąg Nazwa pola indeksu, które ma być używane jako tytuł. No
url_field ciąg Nazwa pola indeksu, które ma być używane jako adres URL. No
vector_fields macierz Nazwy pól reprezentujących dane wektorowe. No

azureSearchQueryType

Typ zapytania wyszukiwania w usłudze Azure Search, który należy wykonać podczas korzystania z niej jako rozszerzenia czatu w usłudze Azure OpenAI.

Property Value
Description Typ zapytania wyszukiwania w usłudze Azure Search, który należy wykonać podczas korzystania z niej jako rozszerzenia czatu w usłudze Azure OpenAI.
Type ciąg
Values simple
semantic
vector
vector_simple_hybrid
vector_semantic_hybrid

azureCosmosDBChatExtensionConfiguration

Konkretna reprezentacja konfigurowalnych opcji dla usługi Azure Cosmos DB w przypadku korzystania z niej jako rozszerzenia czatu usługi Azure OpenAI.

Name Typ Description Required Default
parameters azureCosmosDBChatExtensionParameters Parametry do użycia podczas konfigurowania rozszerzenia czatu usługi Azure OpenAI na czacie danych podczas korzystania z usługi Azure Cosmos DB dla rdzeni wirtualnych bazy danych MongoDB. No
typ azureChatExtensionType Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi.
Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.
Yes

azureCosmosDBChatExtensionParameters

Parametry do użycia podczas konfigurowania rozszerzenia czatu usługi Azure OpenAI na czacie danych podczas korzystania z usługi Azure Cosmos DB dla rdzeni wirtualnych bazy danych MongoDB.

Name Typ Description Required Default
allow_partial_result boolean Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. No False
uwierzytelnianie onYourDataConnectionStringAuthenticationOptions Opcje uwierzytelniania dla Azure OpenAI na Twoich danych przy użyciu ciągu połączenia. Yes
container_name ciąg Nazwa kontenera zasobów usługi Azure Cosmos DB. Yes
database_name ciąg Nazwa bazy danych MongoDB vCore do użycia z Azure Cosmos DB. Yes
embedding_dependency onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource Yes
fields_mapping azureCosmosDBFieldMappingOptions Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól przy użyciu skonfigurowanego zasobu usługi Azure Cosmos DB. Yes
in_scope boolean Czy zapytania powinny być ograniczone do używania indeksowanych danych. No
include_contexts macierz Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. No
index_name ciąg Nazwa indeksu vCore MongoDB do użycia z Azure Cosmos DB. Yes
max_search_queries liczba całkowita Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. No
strictness liczba całkowita Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. No
top_n_documents liczba całkowita Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. No

azureCosmosDBFieldMappingOptions

Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól przy użyciu skonfigurowanego zasobu usługi Azure Cosmos DB.

Name Typ Description Required Default
content_fields macierz Nazwy pól indeksu, które powinny być traktowane jako zawartość. Yes
content_fields_separator ciąg Wzorzec separatora, którego powinny używać pola zawartości. No
filepath_field ciąg Nazwa pola indeksu do użycia jako ścieżka pliku. No
title_field ciąg Nazwa pola indeksu, które ma być używane jako tytuł. No
url_field ciąg Nazwa pola indeksu, które ma być używane jako adres URL. No
vector_fields macierz Nazwy pól reprezentujących dane wektorowe. Yes

elasticsearchChatExtensionConfiguration

Konkretna reprezentacja konfigurowalnych opcji usługi Elasticsearch podczas korzystania z niej jako rozszerzenia czatu usługi Azure OpenAI.

Name Typ Description Required Default
parameters elasticsearchChatExtensionParameters Parametry do użycia podczas konfigurowania elasticsearchâ® jako rozszerzenia czatu usługi Azure OpenAI. No
typ azureChatExtensionType Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi.
Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.
Yes

elasticsearchChatExtensionParameters

Parametry do użycia podczas konfigurowania elasticsearchâ® jako rozszerzenia czatu usługi Azure OpenAI.

Name Typ Description Required Default
allow_partial_result boolean Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. No False
uwierzytelnianie onYourDataKeyAndKeyIdAuthenticationOptions lub onYourDataEncodedApiKeyAuthenticationOptions Yes
embedding_dependency onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource lub onYourDataModelIdVectorizationSource No
punkt końcowy ciąg Punkt końcowy usługi Elasticsearch®. Yes
fields_mapping elasticsearchIndexFieldMappingOptions Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól przy użyciu skonfigurowanego zasobu Elasticsearch®. No
in_scope boolean Czy zapytania powinny być ograniczone do używania indeksowanych danych. No
include_contexts macierz Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. No
index_name ciąg Nazwa indeksu Elasticsearch®. Yes
max_search_queries liczba całkowita Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. No
query_type elasticsearchQueryType Typ zapytania pobierania Elasticsearch®, które należy wykonać podczas korzystania z Elasticsearch jako rozszerzenia czatu usługi Azure OpenAI. No
strictness liczba całkowita Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. No
top_n_documents liczba całkowita Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. No

elasticsearchIndexFieldMappingOptions

Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól przy użyciu skonfigurowanego zasobu Elasticsearch®.

Name Typ Description Required Default
content_fields macierz Nazwy pól indeksu, które powinny być traktowane jako zawartość. No
content_fields_separator ciąg Wzorzec separatora, którego powinny używać pola zawartości. No
filepath_field ciąg Nazwa pola indeksu do użycia jako ścieżka pliku. No
title_field ciąg Nazwa pola indeksu, które ma być używane jako tytuł. No
url_field ciąg Nazwa pola indeksu, które ma być używane jako adres URL. No
vector_fields macierz Nazwy pól reprezentujących dane wektorowe. No

elasticsearchQueryType

Typ zapytania pobierania Elasticsearch®, które należy wykonać podczas korzystania z Elasticsearch jako rozszerzenia czatu usługi Azure OpenAI.

Property Value
Description Typ zapytania pobierania Elasticsearch®, które należy wykonać podczas korzystania z Elasticsearch jako rozszerzenia czatu usługi Azure OpenAI.
Type ciąg
Values simple
vector

mongoDBChatExtensionConfiguration

Konkretna reprezentacja konfigurowalnych opcji bazy danych Mongo DB podczas korzystania z niej jako rozszerzenia czatu usługi Azure OpenAI.

Name Typ Description Required Default
parameters mongoDBChatExtensionParameters Parametry do użycia podczas konfigurowania rozszerzenia czatu usługi Azure OpenAI na czacie danych podczas korzystania z bazy danych Mongo DB. No
typ azureChatExtensionType Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi.
Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.
Yes

mongoDBChatExtensionParameters

Parametry do użycia podczas konfigurowania rozszerzenia czatu usługi Azure OpenAI na czacie danych podczas korzystania z bazy danych Mongo DB.

Name Typ Description Required Default
allow_partial_result boolean Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. No False
app_name ciąg Nazwa aplikacji mongo DB. Yes
uwierzytelnianie onYourDataUsernameAndPasswordAuthenticationOptions Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data podczas korzystania z nazwy użytkownika i hasła. Yes
collection_name ciąg Nazwa kolekcji mongo DB. Yes
database_name ciąg Nazwa bazy danych Mongo DB. Yes
embedding_dependency onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource Yes
punkt końcowy ciąg Nazwa punktu końcowego klastra bazy danych Mongo DB. Yes
fields_mapping mongoDBFieldMappingOptions Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu bazy danych Mongo DB. Yes
in_scope boolean Czy zapytania powinny być ograniczone do używania indeksowanych danych. No
include_contexts macierz Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. No
index_name ciąg Nazwa indeksu bazy danych Mongo DB. Yes
max_search_queries liczba całkowita Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. No
strictness liczba całkowita Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. No
top_n_documents liczba całkowita Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. No

mongoDBFieldMappingOptions

Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu bazy danych Mongo DB.

Name Typ Description Required Default
content_fields macierz Nazwy pól indeksu, które powinny być traktowane jako zawartość. Yes
content_fields_separator ciąg Wzorzec separatora, którego powinny używać pola zawartości. No
filepath_field ciąg Nazwa pola indeksu do użycia jako ścieżka pliku. No
title_field ciąg Nazwa pola indeksu, które ma być używane jako tytuł. No
url_field ciąg Nazwa pola indeksu, które ma być używane jako adres URL. No
vector_fields macierz Nazwy pól reprezentujących dane wektorowe. Yes

pineconeChatExtensionConfiguration

Konkretna reprezentacja konfigurowalnych opcji pinecone podczas korzystania z niej jako rozszerzenia czatu Usługi Azure OpenAI.

Name Typ Description Required Default
parameters pineconeChatExtensionParameters Parametry konfigurowania rozszerzeń czatu Pinecone w usłudze Azure OpenAI. No
typ azureChatExtensionType Reprezentacja danych konfiguracji dla pojedynczego rozszerzenia czatu usługi Azure OpenAI. Będzie to używane przez żądanie ukończenia czatu, które powinno używać rozszerzeń do czatu Azure OpenAI w celu poprawy zachowania odpowiedzi.
Użycie tej konfiguracji jest zgodne tylko z usługą Azure OpenAI.
Yes

pineconeChatExtensionParameters

Parametry konfigurowania rozszerzeń czatu Pinecone w usłudze Azure OpenAI.

Name Typ Description Required Default
allow_partial_result boolean Jeśli określono wartość true, system zezwoli na użycie częściowych wyników wyszukiwania, a żądanie zakończy się niepowodzeniem, jeśli wszystkie zapytania kończą się niepowodzeniem. Jeśli nie zostanie określony lub określony jako false, żądanie zakończy się niepowodzeniem, jeśli jakiekolwiek zapytanie wyszukiwania zakończy się niepowodzeniem. No False
uwierzytelnianie onYourDataApiKeyAuthenticationOptions Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data przy użyciu klucza API. Yes
embedding_dependency onYourDataDeploymentNameVectorizationSource Szczegóły źródła wektoryzacji używanego przez usługę Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego opartego na wewnętrznej nazwie wdrożenia modelu osadzania w tym samym zasobie usługi Azure OpenAI. Yes
środowisko ciąg Nazwa środowiska Pinecone. Yes
fields_mapping pineconeFieldMappingOptions Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu Pinecone. Yes
in_scope boolean Czy zapytania powinny być ograniczone do używania indeksowanych danych. No
include_contexts macierz Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie zostanie określony, wartość domyślna to citations i intent. No
index_name ciąg Nazwa indeksu bazy danych Pinecone. Yes
max_search_queries liczba całkowita Maksymalna liczba przepisanych zapytań powinna być wysyłana do dostawcy wyszukiwania dla jednego komunikatu użytkownika. Jeśli nie zostanie określony, system zdecyduje o liczbie zapytań do wysłania. No
strictness liczba całkowita Skonfigurowana dokładność filtrowania istotności wyszukiwania. Im większa jest surowość, tym większa precyzja, ale niższa kompletność odpowiedzi. No
top_n_documents liczba całkowita Skonfigurowana maksymalna liczba dokumentów do wyświetlenia dla skonfigurowanego zapytania. No

pineconeFieldMappingOptions

Opcjonalne ustawienia umożliwiające kontrolowanie sposobu przetwarzania pól podczas korzystania ze skonfigurowanego zasobu Pinecone.

Name Typ Description Required Default
content_fields macierz Nazwy pól indeksu, które powinny być traktowane jako zawartość. Yes
content_fields_separator ciąg Wzorzec separatora, którego powinny używać pola zawartości. No
filepath_field ciąg Nazwa pola indeksu do użycia jako ścieżka pliku. No
title_field ciąg Nazwa pola indeksu, które ma być używane jako tytuł. No
url_field ciąg Nazwa pola indeksu, które ma być używane jako adres URL. No

onYourDataAuthenticationOptions

Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data.

Dyskryminator dla opcji uwierzytelniania onYourData

Ten składnik używa właściwości type do rozróżniania różnych typów:

Wartość typu Schema
api_key onYourDataApiKeyAuthenticationOptions
connection_string onYourDataConnectionStringAuthenticationOptions
key_and_key_id onYourDataKeyAndKeyIdAuthenticationOptions
encoded_api_key onYourDataEncodedApiKeyAuthenticationOptions
access_token onYourDataAccessTokenAuthenticationOptions
system_assigned_managed_identity onYourDataSystemAssignedManagedIdentityAuthenticationOptions
user_assigned_managed_identity onYourDataUserAssignedManagedIdentityAuthenticationOptions
username_and_password onYourDataUsernameAndPasswordAuthenticationOptions
Name Typ Description Required Default
typ onYourDataAuthenticationType Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. Yes

onYourDataContextProperty

Właściwość kontekstu.

Property Value
Description Właściwość kontekstu.
Type ciąg
Values citations
intent
all_retrieved_documents

onYourDataAuthenticationType

Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych.

Property Value
Description Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych.
Type ciąg
Values api_key
connection_string
key_and_key_id
encoded_api_key
access_token
system_assigned_managed_identity
user_assigned_managed_identity
username_and_password

onYourDataApiKeyAuthenticationOptions

Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data przy użyciu klucza API.

Name Typ Description Required Default
klucz ciąg Klucz interfejsu API do użycia do uwierzytelniania. No
typ onYourDataAuthenticationType Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. Yes

onYourDataConnectionStringAuthenticationOptions

Opcje uwierzytelniania dla Azure OpenAI na Twoich danych przy użyciu ciągu połączenia.

Name Typ Description Required Default
connection_string ciąg Parametry połączenia do użycia do uwierzytelniania. No
typ onYourDataAuthenticationType Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. Yes

onYourDataKeyAndKeyIdAuthenticationOptions

Opcje uwierzytelniania dla usługi Azure OpenAI Na danych podczas korzystania z pary kluczy Elasticsearch i identyfikatora klucza.

Name Typ Description Required Default
klucz ciąg Klucz elasticsearch do użycia do uwierzytelniania. No
key_id ciąg Identyfikator klucza elasticsearch do użycia do uwierzytelniania. No
typ onYourDataAuthenticationType Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. Yes

onYourDataEncodedApiKeyAuthenticationOptions

Opcje uwierzytelniania usługi Azure OpenAI na danych podczas korzystania z klucza interfejsu API zakodowanego w usłudze Elasticsearch.

Name Typ Description Required Default
encoded_api_key ciąg Klucz interfejsu API zakodowanego w usłudze Elasticsearch do użycia na potrzeby uwierzytelniania. No
typ onYourDataAuthenticationType Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. Yes

onYourDataAccessTokenAuthenticationOptions

Opcje uwierzytelniania dla usługi Azure OpenAI Na danych podczas korzystania z tokenu dostępu.

Name Typ Description Required Default
access_token ciąg Token dostępu do użycia do uwierzytelniania. No
typ onYourDataAuthenticationType Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. Yes

onYourDataSystemAssignedManagedIdentityAuthenticationOptions

Opcje uwierzytelniania usługi Azure OpenAI na danych podczas korzystania z tożsamości zarządzanej przypisanej przez system.

Name Typ Description Required Default
typ onYourDataAuthenticationType Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. Yes

onYourDataUserAssignedManagedIdentityAuthenticationOptions

Opcje uwierzytelniania dla Azure OpenAI w odniesieniu do Twoich danych, korzystając z przypisanej przez użytkownika tożsamości zarządzanej.

Name Typ Description Required Default
managed_identity_resource_id ciąg Identyfikator zasobu tożsamości zarządzanej przypisanej przez użytkownika do użycia do uwierzytelniania. No
typ onYourDataAuthenticationType Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. Yes

onYourDataUsernameAndPasswordAuthenticationOptions

Opcje uwierzytelniania dla usługi Azure OpenAI On Your Data podczas korzystania z nazwy użytkownika i hasła.

Name Typ Description Required Default
hasło ciąg Hasło. do użycia do uwierzytelniania. No
typ onYourDataAuthenticationType Typy uwierzytelniania obsługiwane przez Azure OpenAI z użyciem Twoich danych. Yes
nazwa użytkownika ciąg Nazwa użytkownika używana do uwierzytelniania. No

onYourDataVectorizationSource

Abstrakcyjna reprezentacja źródła wektoryzacji dla usługi Azure OpenAI On Your Data z wyszukiwaniem wektorowym.

Ten składnik używa właściwości type do rozróżniania różnych typów:

Wartość typu Schema
endpoint onYourDataEndpointVectorizationSource
deployment_name onYourDataDeploymentNameVectorizationSource
integrated onYourDataIntegratedVectorizationSource
model_id onYourDataModelIdVectorizationSource
Name Typ Description Required Default
typ onYourDataVectorizationSourceType Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. Yes

onYourDataVectorizationSourceType

Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym.

Property Value
Description Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym.
Type ciąg
Values endpoint
deployment_name
integrated
model_id

onYourDataEndpointVectorizationSource

Szczegóły źródła wektoryzacji używanego przez usługę Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego opartego na publicznym wywołaniu punktu końcowego usługi Azure OpenAI na potrzeby osadzania.

Name Typ Description Required Default
uwierzytelnianie onYourDataApiKeyAuthenticationOptions lub onYourDataAccessTokenAuthenticationOptions No
dimensions liczba całkowita Liczba wymiarów osadzania powinna mieć wartość . Obsługiwane tylko w text-embedding-3 modelach i nowszych. No
punkt końcowy ciąg Określa adres URL punktu końcowego zasobu, z którego mają zostać pobrane osadzanie. Powinien mieć format https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings. Parametr zapytania w wersji interfejsu API nie jest dozwolony. No
typ onYourDataVectorizationSourceType Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. Yes

onYourDataDeploymentNameVectorizationSource

Szczegóły źródła wektoryzacji używanego przez usługę Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego opartego na wewnętrznej nazwie wdrożenia modelu osadzania w tym samym zasobie usługi Azure OpenAI.

Name Typ Description Required Default
deployment_name ciąg Określa nazwę wdrożenia modelu do użycia na potrzeby wektoryzacji. To wdrożenie modelu musi znajdować się w tym samym zasobie usługi Azure OpenAI, ale funkcja "On Your Data" będzie korzystać z tego wdrożenia modelu za pośrednictwem wywołania wewnętrznego zamiast publicznego, co umożliwia wyszukiwanie wektorów nawet w sieciach prywatnych. No
dimensions liczba całkowita Liczba wymiarów osadzania powinna mieć wartość . Obsługiwane tylko w text-embedding-3 modelach i nowszych. No
typ onYourDataVectorizationSourceType Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. Yes

onYourDataIntegratedVectorizationSource

Reprezentuje zintegrowany wektoryzator zdefiniowany w ramach zasobu wyszukiwania.

Name Typ Description Required Default
typ onYourDataVectorizationSourceType Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. Yes

onYourDataModelIdVectorizationSource

Szczegóły źródła wektoryzacji używanego przez usługę Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego opartego na identyfikatorze modelu usługi wyszukiwania. Obecnie obsługiwane tylko przez elasticsearchâ®.

Name Typ Description Required Default
model_id ciąg Określa identyfikator modelu, który ma być używany do wektoryzacji. Ten identyfikator modelu musi być zdefiniowany w usłudze wyszukiwania. No
typ onYourDataVectorizationSourceType Reprezentuje dostępne źródła, które usługa Azure OpenAI On Your Data może wykorzystać do konfigurowania wektoryzacji danych do użycia z wyszukiwaniem wektorowym. Yes

azureChatExtensionsMessageContext

Reprezentacja dodatkowych informacji kontekstowych dostępnych, gdy w generowanie odpowiedzi na czat są zaangażowane rozszerzenia czatu Azure OpenAI. Te informacje kontekstowe są wypełniane tylko w przypadku używania żądania usługi Azure OpenAI skonfigurowanego do używania zgodnego rozszerzenia.

Name Typ Description Required Default
all_retrieved_documents macierz Wszystkie pobrane dokumenty. No
citations macierz Wynik pobierania źródła danych używany do generowania komunikatu asystenta w odpowiedzi. No
intencja ciąg Wykryta intencja z historii czatu, używana przy przejściu do następnego kroku, by przenieść kontekst. No

citation

informacje o cytatach dla komunikatu odpowiedzi zakończenia czatu.

Name Typ Description Required Default
chunk_id ciąg Identyfikator fragmentu cytatu. No
zawartość ciąg Zawartość cytatu. Yes
filepath ciąg Ścieżka pliku cytatu. No
rerank_score number Wynik ponownego generowania pobranego dokumentu. No
title ciąg Tytuł cytatu. No
url ciąg Adres URL cytatu. No

retrievedDocument

Pobrany dokument.

Name Typ Description Required Default
chunk_id ciąg Identyfikator fragmentu cytatu. No
zawartość ciąg Zawartość cytatu. Yes
data_source_index liczba całkowita Indeks źródła danych. No
filepath ciąg Ścieżka pliku cytatu. No
filter_reason filterReason Przyczyna filtrowania pobranego dokumentu. No
original_search_score number Oryginalny wynik wyszukiwania pobranego dokumentu. No
rerank_score number Wynik ponownego generowania pobranego dokumentu. No
search_queries macierz Zapytania wyszukiwania używane do pobierania dokumentu. No
title ciąg Tytuł cytatu. No
url ciąg Adres URL cytatu. No

filterReason

Przyczyna filtrowania pobranego dokumentu.

Property Value
Description Przyczyna filtrowania pobranego dokumentu.
Type ciąg
Values score
rerank

chatCompletionMessageToolCall

Name Typ Description Required Default
funkcja obiekt Funkcja, którą wywołał model. Yes
└─ Argumenty ciąg Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. No
└─ nazwa ciąg Nazwa funkcji do wywołania. No
id ciąg Identyfikator wywołania narzędzia. Yes
typ toolCallType Typ wywołania narzędzia, w tym przypadku function. Yes

toolCallType

Typ wywołania narzędzia, w tym przypadku function.

Property Value
Description Typ wywołania narzędzia, w tym przypadku function.
Type ciąg
Values function

chatCompletionRequestMessageTool

Name Typ Description Required Default
zawartość ciąg Zawartość wiadomości. No
tool_call_id ciąg Wywołanie narzędzia, na które odpowiada ten komunikat. No

chatCompletionRequestMessageFunction

Name Typ Description Required Default
zawartość ciąg Zawartość wiadomości. No
name ciąg Zawartość wiadomości. No
rola wyliczenie Rola autora komunikatów, w tym przypadku function.
Możliwe wartości: function
No

createChatCompletionResponse

Reprezentuje odpowiedź na zakończenie czatu zwróconą przez model na podstawie podanych danych wejściowych.

Name Typ Description Required Default
choices macierz Lista opcji ukończenia czatu. Może być więcej niż jeden, jeśli n jest większy niż 1. Yes
created liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) wskazująca moment utworzenia zakończenia czatu. Yes
id ciąg Unikatowy identyfikator ukończenia czatu. Yes
model ciąg Model używany do ukończenia czatu. Yes
obiekt wyliczenie Typ obiektu, który jest zawsze chat.completion.
Możliwe wartości: chat.completion
Yes
prompt_filter_results promptFilterResults Wyniki filtrowania zawartości dla zera lub większej liczby monitów w żądaniu. W żądaniu przesyłania strumieniowego wyniki dla różnych poleceń mogą pojawiać się o różnych porach lub w różnej kolejności. No
system_fingerprint ciąg Ten odcisk palca reprezentuje zaplecze systemowe, z którym działa model.

Można użyć w połączeniu z parametrem żądania seed, aby zrozumieć, kiedy wprowadzono zmiany w back-endzie, które mogą wpływać na deterministyczne działanie.
No
użycie completionUsage Statystyki użycia dotyczące żądania zakończenia. No

createChatCompletionStreamResponse

Reprezentuje fragment strumienia odpowiedzi ukończenia czatu zwróconej przez model na podstawie podanych danych wejściowych.

Name Typ Description Required Default
choices macierz Lista opcji ukończenia czatu. Może zawierać więcej niż jeden element, jeśli n jest większy niż 1.
Yes
created liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) wskazująca moment utworzenia zakończenia czatu. Każdy fragment ma ten sam znacznik czasu. Yes
id ciąg Unikatowy identyfikator ukończenia czatu. Każdy fragment ma ten sam identyfikator. Yes
model ciąg Model do generowania dokończeń. Yes
obiekt wyliczenie Typ obiektu, który jest zawsze chat.completion.chunk.
Możliwe wartości: chat.completion.chunk
Yes
system_fingerprint ciąg Ten odcisk palca reprezentuje zaplecze systemowe, z którym działa model.
Można użyć w połączeniu z parametrem żądania seed, aby zrozumieć, kiedy wprowadzono zmiany w back-endzie, które mogą wpływać na deterministyczne działanie.
No

chatCompletionStreamResponseDelta

Delta ukończenia czatu wygenerowana przez przesyłane strumieniowo odpowiedzi modelu.

Name Typ Description Required Default
zawartość ciąg Zawartość sekcji wiadomości. No
function_call obiekt Przestarzałe i zastąpione przez tool_calls. Nazwa i argumenty funkcji, które powinny być wywoływane, generowane przez model. No
└─ Argumenty ciąg Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. No
└─ nazwa ciąg Nazwa funkcji do wywołania. No
refusal ciąg Komunikat o odmowie wygenerowany przez model. No
rola wyliczenie Rola autora tej wiadomości.
Możliwe wartości: system, , user, assistanttool
No
tool_calls macierz No

chatCompletionMessageToolCallChunk

Name Typ Description Required Default
funkcja obiekt No
└─ Argumenty ciąg Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. No
└─ nazwa ciąg Nazwa funkcji do wywołania. No
id ciąg Identyfikator wywołania narzędzia. No
indeks liczba całkowita Yes
typ wyliczenie Typ narzędzia. Obecnie obsługiwany jest tylko function.
Możliwe wartości: function
No

chatCompletionStreamOptions

Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true.

Name Typ Description Required Default
include_usage boolean W przypadku ustawienia przed komunikatem data: [DONE] dodatkowy fragment zostanie przesłany strumieniem. Pole usage w tym fragmentzie pokazuje statystyki użycia tokenu dla całego żądania, a choices pole zawsze będzie pustą tablicą. Wszystkie inne fragmenty będą również zawierać usage pole, ale z wartością null.
No

chatCompletionChoiceLogProbs

Informacje o logarytmicznym prawdopodobieństwie dla wybranej opcji.

Name Typ Description Required Default
zawartość macierz Lista tokenów zawartości komunikatów z informacjami o prawdopodobieństwie logarytmicznym. Yes
refusal macierz Lista tokenów odmowy w wiadomościach z informacjami o prawdopodobieństwach logarytmicznych. No

chatCompletionTokenLogprob

Name Typ Description Required Default
bytes macierz Lista liczb całkowitych reprezentujących reprezentację tokenu w bajtach UTF-8. Przydatne w wystąpieniach, w których znaki są reprezentowane przez wiele tokenów, a ich reprezentacje bajtów muszą być łączone, aby wygenerować poprawną reprezentację tekstu. Może to być null , jeśli nie ma reprezentacji bajtów dla tokenu. Yes
logprob number Logarytm prawdopodobieństwa tego tokenu. Yes
kod przedpłaty ciąg Znacznik. Yes
top_logprobs macierz Lista najbardziej prawdopodobnych tokenów i ich logarytmicznych prawdopodobieństw na tej pozycji tokenu. W rzadkich przypadkach może zostać zwróconych mniej elementów top_logprobs niż liczba żądanych. Yes

chatCompletionResponseMessage

Komunikat ukończenia czatu wygenerowany przez model.

Name Typ Description Required Default
audio obiekt Jeśli zażądano trybu wyjściowego dźwięku, ten obiekt zawiera dane dotyczące odpowiedzi dźwiękowej z modelu. No
└─ dane ciąg Zakodowane w formacie Base64 bajty audio generowane przez model w formacie określonym w żądaniu.
No
└─ wygasa_o liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) określająca, kiedy ta odpowiedź dźwiękowa nie będzie dostępna na serwerze do wykorzystania w konwersacjach wieloetapowych.
No
└─ ID ciąg Unikatowy identyfikator tej odpowiedzi audio. No
└* transkrypcja ciąg Transkrypcja dźwięku wygenerowanego przez model. No
zawartość ciąg Zawartość wiadomości. Yes
kontekst azureChatExtensionsMessageContext Reprezentacja dodatkowych informacji kontekstowych dostępnych, gdy w generowanie odpowiedzi na czat są zaangażowane rozszerzenia czatu Azure OpenAI. Te informacje kontekstowe są wypełniane tylko w przypadku używania żądania usługi Azure OpenAI skonfigurowanego do używania zgodnego rozszerzenia. No
function_call chatCompletionFunctionCall Przestarzałe i zastąpione przez tool_calls. Nazwa i argumenty funkcji, które powinny być wywoływane, generowane przez model. No
refusal ciąg Komunikat o odmowie wygenerowany przez model. Yes
rola chatCompletionResponseMessageRole Rola autora komunikatu odpowiedzi. Yes
tool_calls macierz Wywołania narzędzi generowane przez model, takie jak wywołania funkcji. No

chatCompletionResponseMessageRole

Rola autora komunikatu odpowiedzi.

Property Value
Description Rola autora komunikatu odpowiedzi.
Type ciąg
Values assistant

chatCompletionToolChoiceOption

Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model. none oznacza, że model nie wywoła żadnego narzędzia i zamiast tego generuje komunikat. auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia. required oznacza, że model musi wywoływać co najmniej jedno narzędzie. Określenie określonego narzędzia za pośrednictwem {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model. none jest ustawieniem domyślnym, gdy żadne narzędzia nie są obecne. auto jest wartością domyślną, jeśli istnieją narzędzia.

Ten składnik może być jednym z następujących elementów:

chatCompletionNamedToolChoice

Określa narzędzie, które ma być używane przez model. Użyj, aby wymusić, że model wywoła określoną funkcję.

Name Typ Description Required Default
funkcja obiekt Yes
└─ nazwa ciąg Nazwa funkcji do wywołania. No
typ wyliczenie Typ narzędzia. Obecnie obsługiwany jest tylko function.
Możliwe wartości: function
Yes

ParallelToolCalls

Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia.

Brak zdefiniowanych właściwości dla tego składnika.

PredictionContent

Statyczna przewidywana zawartość wyjściowa, taka jak zawartość pliku tekstowego, który jest ponownie wygenerowany.

Name Typ Description Required Default
zawartość ciąg lub tablica Zawartość, która powinna być dopasowana podczas generowania odpowiedzi modelu. Jeśli wygenerowane tokeny pasują do tej zawartości, cała odpowiedź modelu może zostać zwrócona znacznie szybciej. Yes
typ wyliczenie Typ przewidywanej zawartości, którą chcesz podać. Ten typ jest obecnie zawsze content.
Możliwe wartości: content
Yes

chatCompletionMessageToolCalls

Wywołania narzędzi generowane przez model, takie jak wywołania funkcji.

Brak zdefiniowanych właściwości dla tego składnika.

ChatCompletionModalities

Typy danych wyjściowych, które mają być generowane przez model dla tego żądania. Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną:

["text"]

Model gpt-4o-audio-preview może również służyć do generowania dźwięku. Aby zażądać, aby ten model wygenerował odpowiedzi tekstowe i audio, możesz użyć:

["text", "audio"]

Brak zdefiniowanych właściwości dla tego składnika.

chatCompletionFunctionCall

Przestarzałe i zastąpione przez tool_calls. Nazwa i argumenty funkcji, które powinny być wywoływane, generowane przez model.

Name Typ Description Required Default
arguments ciąg Argumenty do wywołania funkcji za pomocą , wygenerowane przez model w formacie JSON. Należy pamiętać, że model nie zawsze generuje prawidłowy kod JSON i może mieć niezdefiniowane parametry niezdefiniowane przez schemat funkcji. Przed wywołaniem funkcji zweryfikuj argumenty w kodzie. Yes
name ciąg Nazwa funkcji do wywołania. Yes

completionUsage

Statystyki użycia dotyczące żądania zakończenia.

Name Typ Description Required Default
completion_tokens liczba całkowita Liczba tokenów w wygenerowanym zakończeniu. Yes
completion_tokens_details obiekt Podział tokenów używanych w uzupełnieniu. No
└zaakceptowane_tokeny_predykcji liczba całkowita W przypadku korzystania z przewidywanych danych wyjściowych liczba tokenów w przewidywaniu, które pojawiło się w zakończeniu. No
└audio_tokens liczba całkowita Tokeny wejściowe audio generowane przez model. No
└─ tokeny_rozumowania liczba całkowita Tokeny generowane przez model do rozumowania. No
└─ odrzucone_żetony_predykcji liczba całkowita W przypadku korzystania z przewidywanych danych wyjściowych liczba tokenów w przewidywaniu, które nie zostały wyświetlone w zakończeniu. Jednak podobnie jak tokeny rozumowania, te tokeny są nadal liczone w łącznych tokenach ukończenia na potrzeby rozliczeń, danych wyjściowych i limitów okien kontekstowych. No
prompt_tokens liczba całkowita Liczba tokenów w prompt. Yes
prompt_tokens_details obiekt Szczegóły tokenów monitu. No
└audio_tokens liczba całkowita Tokeny wejściowe audio obecne w wierszu polecenia. No
└cached_tokens liczba całkowita Liczba buforowanych tokenów monitów. No
total_tokens liczba całkowita Łączna liczba tokenów użytych w żądaniu (zapytanie + ukończenie). Yes

chatCompletionTool

Name Typ Description Required Default
funkcja FunctionObject Yes
typ wyliczenie Typ narzędzia. Obecnie obsługiwany jest tylko function.
Możliwe wartości: function
Yes

FunctionParameters

Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON. Zapoznaj się z przewodnikiem w celu poznania przykładów oraz z odniesieniem do schematu JSON dla dokumentacji dotyczącej formatu.

Pominięcie parameters definiuje funkcję z pustą listą parametrów.

Brak zdefiniowanych właściwości dla tego składnika.

FunctionObject

Name Typ Description Required Default
description ciąg Opis działania funkcji używanej przez model do wyboru, kiedy i jak wywołać funkcję. No
name ciąg Nazwa funkcji do wywołania. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków. Yes
parameters FunctionParameters Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON. Zapoznaj się z przewodnikiem w celu poznania przykładów oraz z odniesieniem do schematu JSON dla dokumentacji dotyczącej formatu.

Pominięcie parameters definiuje funkcję z pustą listą parametrów.
No
strict boolean Czy włączyć ścisłe przestrzeganie schematu podczas generowania wywołania funkcji. Jeśli ustawiono wartość true, model będzie postępować zgodnie z dokładnym schematem zdefiniowanym parameters w polu. Tylko podzbiór schematu JSON jest obsługiwany, gdy strict ma wartość true. No False

ResponseFormatText

Name Typ Description Required Default
typ wyliczenie Typ zdefiniowanego formatu odpowiedzi: text
Możliwe wartości: text
Yes

ResponseFormatJsonObject

Name Typ Description Required Default
typ wyliczenie Typ zdefiniowanego formatu odpowiedzi: json_object
Możliwe wartości: json_object
Yes

ResponseFormatJsonSchemaSchema

Schemat formatu odpowiedzi, opisany jako obiekt schematu JSON.

Brak zdefiniowanych właściwości dla tego składnika.

ResponseFormatJsonSchema

Name Typ Description Required Default
json_schema obiekt Yes
Opis └* ciąg Opis celu formatu odpowiedzi, który jest używany przez model do określenia, jak odpowiedzieć w tym formacie. No
└─ nazwa ciąg Nazwa formatu odpowiedzi. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków. No
Schemat └* ResponseFormatJsonSchemaSchema Schemat formatu odpowiedzi, opisany jako obiekt schematu JSON. No
└* ścisłe boolean Czy włączyć ścisłe przestrzeganie schematu podczas generowania danych wyjściowych. W przypadku ustawienia wartości true model będzie zawsze przestrzegał dokładnego schematu zdefiniowanego schema w polu. Tylko podzbiór schematu JSON jest obsługiwany, gdy strict ma wartość true. No False
typ wyliczenie Typ zdefiniowanego formatu odpowiedzi: json_schema
Możliwe wartości: json_schema
Yes

chatCompletionChoiceCommon

Name Typ Description Required Default
finish_reason ciąg No
indeks liczba całkowita No

createTranslationRequest

Żądanie tłumaczenia.

Name Typ Description Required Default
plik ciąg Plik audio do tłumaczenia. Yes
monit ciąg Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Monit powinien być w języku angielskim. No
response_format audioResponseFormat Definiuje format danych wyjściowych. No
temperature number Temperatura próbkowania z zakresu od 0 do 1. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Jeśli ustawiono wartość 0, model używa log prawdopodobieństwa, aby automatycznie zwiększyć temperaturę, aż do momentu, gdy przekroczy określone progi. No 0

audioResponse

Odpowiedź tłumaczenia lub transkrypcji, gdy response_format był w formacie JSON

Name Typ Description Required Default
SMS ciąg Przetłumaczony lub transkrypowany tekst. Yes

audioVerboseResponse

Odpowiedź tłumaczenia lub transkrypcji, gdy response_format był verbose_json

Name Typ Description Required Default
duration number Duration. No
język ciąg Language. No
segments macierz No
zadanie ciąg Typ zadania audio. No
SMS ciąg Przetłumaczony lub transkrypowany tekst. Yes
words macierz No

audioResponseFormat

Definiuje format danych wyjściowych.

Property Value
Description Definiuje format danych wyjściowych.
Type ciąg
Values json
text
srt
verbose_json
vtt

createTranscriptionRequest

Żądanie transkrypcji.

Name Typ Description Required Default
plik ciąg Obiekt pliku audio do transkrypcji. Yes
język ciąg Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 zwiększa dokładność i opóźnienie. No
monit ciąg Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Komunikat powinien być zgodny z językiem dźwięku. No
response_format audioResponseFormat Definiuje format danych wyjściowych. No
temperature number Temperatura próbkowania z zakresu od 0 do 1. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne. Jeśli ustawiono wartość 0, model używa log prawdopodobieństwa, aby automatycznie zwiększyć temperaturę, aż do momentu, gdy przekroczy określone progi. No 0
timestamp_granularities[] macierz Stopień szczegółowości sygnatury czasowej do wypełnienia dla tej transkrypcji. response_format należy ustawić, verbose_json aby używać szczegółowości sygnatury czasowej. Obsługiwane są obie te opcje: word, lub segment. Uwaga: nie ma dodatkowego opóźnienia dla znaczników czasu segmentu, ale generowanie znaczników czasu dla wyrazów powoduje dodatkowe opóźnienie. No ['segment']

audioSegment

Transkrypcja lub część tłumaczenia.

Name Typ Description Required Default
avg_logprob number Średnie logarytmiczne prawdopodobieństwo. No
compression_ratio number Współczynnik sprężania. No
end number Przesunięcie końcowe segmentu. No
id liczba całkowita Identyfikator segmentu. No
no_speech_prob number Prawdopodobieństwo braku mowy. No
seek number Przesunięcie segmentu. No
start number Przesunięcie rozpoczęcia segmentu. No
temperature number Temperature. No
SMS ciąg Tekst segmentu. No
tokens macierz Tokeny tekstu. No

audioWord

Transkrypcja lub słowo translacji.

Name Typ Description Required Default
end number Przesunięcie końcowe programu Word. No
start number Przesunięcie rozpoczęcia programu Word. No
słowo ciąg Word No

createSpeechRequest

Żądanie mowy.

Name Typ Description Required Default
dane wejściowe ciąg Tekst do syntezowania dźwięku. Maksymalna długość to 4096 znaków. Yes
response_format wyliczenie Format syntetyzowania dźwięku.
Możliwe wartości: mp3, , opusaac, flac, , wavpcm
No
speed number Szybkość syntetyzowanego dźwięku. Wybierz wartość z 0.25 do 4.0. 1.0 jest wartością domyślną. No 1.0
voice wyliczenie Głos używany do syntezy mowy.
Możliwe wartości: alloy, , echofable, onyx, , novashimmer
Yes

imageQuality

Jakość obrazu, który zostanie wygenerowany.

Property Value
Description Jakość obrazu, który zostanie wygenerowany.
Type ciąg
Default auto
Values auto
high
medium
low
hd
standard

imagesResponseFormat

Format, w którym są zwracane wygenerowane obrazy.

Property Value
Description Format, w którym są zwracane wygenerowane obrazy.
Type ciąg
Default url
Values url
b64_json

imagesOutputFormat

Format pliku, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko w przypadku modeli serii.

Property Value
Description Format pliku, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko w przypadku modeli serii gpt-image-1.
Type ciąg
Default png
Values png
jpeg

imageSize

Rozmiar wygenerowanych obrazów.

Property Value
Description Rozmiar wygenerowanych obrazów.
Type ciąg
Default auto
Values auto
1792x1024
1024x1792
1024x1024
1024x1536
1536x1024

imageStyle

Styl wygenerowanych obrazów. Obsługiwane tylko dla dall-e-3.

Property Value
Description Styl wygenerowanych obrazów. Obsługiwane tylko dla dall-e-3.
Type ciąg
Default vivid
Values vivid
natural

imageBackground

Umożliwia ustawienie przezroczystości tła wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1.

Property Value
Description Umożliwia ustawienie przezroczystości tła wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1.
Type ciąg
Default auto
Values transparent
opaque
auto

imageGenerationsRequest

Name Typ Description Required Default
tło imageBackground Umożliwia ustawienie przezroczystości tła wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1. No auto
n liczba całkowita Liczba obrazów do wygenerowania. Obsługiwane jest tylko n=1 dla dall-e-3. No 1
output_compression liczba całkowita Poziom kompresji (0–100%) dla wygenerowanych obrazów. Ten parametr jest obsługiwany tylko w przypadku modeli serii gpt-image-1 z formatem danych wyjściowych jpeg. No 100
output_format imagesOutputFormat Format pliku, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko w przypadku modeli serii gpt-image-1. No png
monit ciąg Opis tekstu żądanych obrazów. Maksymalna długość to 32000 znaków dla modeli serii gpt-image-1 i 4000 znaków dla dall-e-3 Yes
quality imageQuality Jakość obrazu, który zostanie wygenerowany. No auto
response_format imagesResponseFormat Format, w którym są zwracane wygenerowane obrazy. Obsługiwane tylko dla dall-e-3. No url
size imageSize Rozmiar wygenerowanych obrazów. No auto
styl imageStyle Styl wygenerowanych obrazów. Obsługiwane tylko dla dall-e-3. No vivid
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. No

imageEditsRequest

Name Typ Description Required Default
obraz ciąg lub tablica Obrazy do edycji. Musi być obsługiwanym plikiem obrazu lub tablicą obrazów. Każdy obraz powinien być plikiem png lub jpg mniejszym niż 25 MB. Yes
maska ciąg Dodatkowy obraz, którego w pełni przezroczyste obszary (np. alfa ma wartość zero) wskazują, gdzie ma być edytowany obraz. Jeśli dostępnych jest wiele obrazów, maska zostanie zastosowana do pierwszego obrazu. Musi być prawidłowym plikiem PNG, mniejszym niż 4 MB i mieć takie same wymiary jak obraz. No
n liczba całkowita Liczba obrazów do wygenerowania. No 1
monit ciąg Opis tekstu żądanych obrazów. Maksymalna długość to 32000 znaków. Yes
quality imageQuality Jakość obrazu, który zostanie wygenerowany. No auto
response_format imagesResponseFormat Format, w którym są zwracane wygenerowane obrazy. No url
size imageSize Rozmiar wygenerowanych obrazów. No auto
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. No

generateImagesResponse

Name Typ Description Required Default
created liczba całkowita Sygnatura czasowa systemu unix podczas tworzenia operacji. Yes
dane macierz Dane wynikowe operacji, jeśli operacja zakończyła się pomyślnie Yes
użycie imageGenerationsUsage Reprezentuje szczegóły użycia tokenu dla żądań generowania obrazów. Tylko w przypadku modeli serii gpt-image-1. No

imageResult

Adres URL obrazu lub zakodowany obraz, jeśli się powiedzie, i błąd w przeciwnym razie.

Name Typ Description Required Default
b64_json ciąg Obraz zakodowany w formacie base64 No
content_filter_results dalleContentFilterResults Informacje o wynikach filtrowania zawartości. No
prompt_filter_results dalleFilterResults Informacje o kategorii filtrowania treści (nienawiść, treści seksualne, przemoc, samookaleczenia), jeśli zostały wykryte, a także o poziomie ważności (bardzo niski, niski, średni, wysoki, które określają intensywność i poziom ryzyka szkodliwej zawartości) oraz czy zostały przefiltrowane, czy nie. Informacje o zawartości jailbreaku i wulgaryzmach, jeśli zostały wykryte i czy zostały odfiltrowane, czy nie. Informacje o liście zablokowanych klientów, jeśli zostały odfiltrowane i jej identyfikator. No
revised_prompt ciąg Polecenie, które zostało użyte do wygenerowania obrazu, jeśli dokonano jakiejkolwiek poprawki do podpowiedzi. No
url ciąg Adres URL obrazu. No

imageGenerationsUsage

Reprezentuje szczegóły użycia tokenu dla żądań generowania obrazów. Tylko w przypadku modeli serii gpt-image-1.

Name Typ Description Required Default
input_tokens liczba całkowita Liczba tokenów wejściowych. No
input_tokens_details obiekt Szczegółowy podział tokenów wejściowych. No
└image_tokens liczba całkowita Liczba tokenów obrazu. No
└ text_tokens liczba całkowita Liczba tokenów tekstowych. No
output_tokens liczba całkowita Liczba tokenów wyjściowych. No
total_tokens liczba całkowita Całkowita liczba użytych tokenów. No

linia

Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.

Name Typ Description Required Default
spans macierz Tablica zakresów reprezentujących wykryte obiekty i informacje o polu ograniczenia. Yes
SMS ciąg Yes

span

Obiekt span reprezentujący wykryty obiekt i informacje o polu ograniczenia.

Name Typ Description Required Default
length liczba całkowita Długość zakresu w znakach mierzona w punktach kodu Unicode. Yes
przesunąć liczba całkowita Przesunięcie znaku w tekście, na którym rozpoczyna się zakres. To przesunięcie jest definiowane jako pozycja pierwszego znaku zakresu, licząc od początku tekstu jako punkty kodowe Unicode. Yes
polygon macierz Tablica obiektów reprezentujących punkty w wielokącie, który otacza wykryty obiekt. Yes
SMS ciąg Zawartość tekstowa zakresu reprezentująca wykryty obiekt. Yes

runCompletionUsage

Statystyki użycia związane z uruchomieniem. Ta wartość będzie taka null , jeśli przebieg nie znajduje się w stanie terminalu (np. in_progress, queueditp.).

Name Typ Description Required Default
completion_tokens liczba całkowita Liczba tokenów ukończenia używanych w trakcie przebiegu. Yes
prompt_tokens liczba całkowita Liczba tokenów monitu używanych w trakcie przebiegu. Yes
total_tokens liczba całkowita Łączna liczba użytych tokenów (monit i ukończenie). Yes

runStepCompletionUsage

Statystyki użycia związane z krokiem uruchamiania. Ta wartość będzie mieć null stan , gdy stan kroku uruchomienia to in_progress.

Name Typ Description Required Default
completion_tokens liczba całkowita Liczba tokenów ukończenia używanych w trakcie kroku uruchamiania. Yes
prompt_tokens liczba całkowita Liczba tokenów monitu używanych w trakcie kroku uruchamiania. Yes
total_tokens liczba całkowita Łączna liczba użytych tokenów (monit i ukończenie). Yes

assistantsApiResponseFormatOption

Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.

Ten składnik może być jednym z następujących elementów:

assistantsApiResponseFormat

Obiekt opisujący oczekiwane dane wyjściowe modelu. Jeśli json_object tylko typ function może zostać przekazany do tools przebiegu. Jeśli text model może zwrócić tekst lub dowolną wymaganą wartość.

Name Typ Description Required Default
typ ciąg Musi być jednym z text lub json_object. No SMS

typ Enum: AssistantsApiResponseFormat

Value Description
SMS
json_object

assistantObject

Reprezentuje element assistant , który może wywoływać model i używać narzędzi.

Name Typ Description Required Default
created_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia asystenta. Yes
description ciąg Opis asystenta. Maksymalna długość to 512 znaków.
Yes
id ciąg Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. Yes
instructions ciąg Instrukcje systemowe używane przez asystenta. Maksymalna długość to 256 000 znaków.
Yes
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
Yes
model ciąg Identyfikator modelu do użycia. Yes
name ciąg Nazwa asystenta. Maksymalna długość to 256 znaków.
Yes
obiekt ciąg Typ obiektu, który jest zawsze assistant. Yes
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
No 1
tool_resources obiekt Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Identyfikator magazynu wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta.
No
tools macierz Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, file_searchlub function.
Yes []
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu.
No 1

object Enum: AssistantObjectType

Value Description
asystent Typ obiektu, który jest zawsze asystentem

createAssistantRequest

Name Typ Description Required Default
description ciąg Opis asystenta. Maksymalna długość to 512 znaków.
No
instructions ciąg Instrukcje systemowe używane przez asystenta. Maksymalna długość to 256 000 znaków.
No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
model ciąg Yes
name ciąg Nazwa asystenta. Maksymalna długość to 256 znaków.
No
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
No 1
tool_resources obiekt Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Magazyn wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta.
No
└─ przechowalnie_wektorów macierz Pomocnik do tworzenia magazynu wektorów z file_ids i dołączania go do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta.
No
tools macierz Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, retrievallub function.
No []
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu.
No 1

modifyAssistantRequest

Name Typ Description Required Default
description ciąg Opis asystenta. Maksymalna długość to 512 znaków.
No
instructions ciąg Instrukcje systemowe używane przez asystenta. Maksymalna długość to 32768 znaków.
No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
model ciąg No
name ciąg Nazwa asystenta. Maksymalna długość to 256 znaków.
No
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
No 1
tool_resources obiekt Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Zastępuje listę identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Zastępuje magazyn wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta.
No
tools macierz Lista narzędzi włączona w asystencie. Może istnieć maksymalnie 128 narzędzi na asystenta. Narzędzia mogą być typami code_interpreter, retrievallub function.
No []
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu.
No 1

deleteAssistantResponse

Name Typ Description Required Default
deleted boolean Yes
id ciąg Yes
obiekt ciąg Yes

object Enum: DeleteAssistantResponseState

Value Description
assistant.deleted

listAssistantsResponse

Name Typ Description Required Default
dane macierz Yes
first_id ciąg Yes
has_more boolean Yes
last_id ciąg Yes
obiekt ciąg Yes

assistantToolsCode

Name Typ Description Required Default
typ ciąg Typ zdefiniowanego narzędzia: code_interpreter Yes

typ Enum: assistantToolsCodeType

Value Description
code_interpreter

assistantToolsFileSearch

Name Typ Description Required Default
file_search obiekt Zastępuje narzędzie do wyszukiwania plików. No
└max_num_results liczba całkowita Maksymalna liczba wyników, które narzędzie wyszukiwania plików powinno wyświetlić. Wartość domyślna to 20 dla modeli gpt-4* i 5 dla gpt-3,5-turbo. Ta liczba powinna należeć do zakresu od 1 do 50 włącznie.

Należy pamiętać, że narzędzie wyszukiwania plików może zwracać mniej niż max_num_results wyniki.
No
typ ciąg Typ zdefiniowanego narzędzia: file_search Yes

type Enum: typWyszukiwaniaPlikówNarzędziAsystenta

Value Description
file_search

assistantToolsFileSearchTypeOnly

Name Typ Description Required Default
typ ciąg Typ zdefiniowanego narzędzia: file_search Yes

type Enum: typWyszukiwaniaPlikówNarzędziAsystenta

Value Description
file_search

assistantToolsFunction

Name Typ Description Required Default
funkcja obiekt Definicja funkcji. Yes
Opis └* ciąg Opis działania funkcji używanej przez model do wyboru, kiedy i jak wywołać funkcję. No
└─ nazwa ciąg Nazwa funkcji do wywołania. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków. No
Parametry chatCompletionFunctionParameters Parametry akceptowane przez funkcje, opisane jako obiekt schematu JSON. Zapoznaj się z przewodnikiem/, aby zapoznać się z przykładami, oraz dokumentacją dotyczącą schematu JSON, aby uzyskać dokumentację dotyczącą formatu. No
typ ciąg Typ zdefiniowanego narzędzia: function Yes

type Enum: assistantToolsFunction

Value Description
funkcja

truncationObject

Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu.

Name Typ Description Required Default
last_messages liczba całkowita Liczba najnowszych komunikatów z wątku podczas konstruowania kontekstu przebiegu. No
typ ciąg Strategia obcinania do użycia dla wątku. Wartość domyślna to auto. Jeśli ustawiono wartość last_messages, wątek zostanie obcięty do n najnowszych komunikatów w wątku. Po ustawieniu autowartości na wartość komunikaty w środku wątku zostaną porzucone w celu dopasowania do długości kontekstu modelu . max_prompt_tokens Yes

typ Enum: TruncationType

Value Description
auto
last_messages

assistantsApiToolChoiceOption

Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model. none oznacza, że model nie będzie wywoływać żadnych narzędzi i zamiast tego generuje komunikat. auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia. Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.

Ten składnik może być jednym z następujących elementów:

assistantsNamedToolChoice

Określa narzędzie, które ma być używane przez model. Użyj polecenia , aby wymusić wywołanie określonego narzędzia przez model.

Name Typ Description Required Default
funkcja obiekt No
└─ nazwa ciąg Nazwa funkcji do wywołania. No
typ ciąg Typ narzędzia. Jeśli typ to function, należy ustawić nazwę funkcji Yes

typ Enumowy: AssistantsNamedToolChoiceType

Value Description
funkcja
code_interpreter
file_search

runObject

Reprezentuje przebieg wykonywania w wątkach.

Name Typ Description Required Default
assistant_id ciąg Identyfikator asystenta używanego do wykonywania tego przebiegu. Yes
cancelled_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu anulowania przebiegu. Yes
completed_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu ukończenia przebiegu. Yes
created_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia przebiegu. Yes
expires_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla czasu wygaśnięcia przebiegu. Yes
failed_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla czasu niepowodzenia uruchomienia. Yes
id ciąg Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. Yes
incomplete_details obiekt Szczegółowe informacje o tym, dlaczego przebieg jest niekompletny. Będzie to null , jeśli przebieg nie jest niekompletny. Yes
└* przyczyna ciąg Powód, dla którego przebieg jest niekompletny. Będzie to wskazywać, który limit tokenów został osiągnięty w trakcie przebiegu. No
instructions ciąg Instrukcje używane przez asystenta do tego przebiegu. Yes
last_error obiekt Ostatni błąd skojarzony z tym przebiegiem. Jeśli nie ma żadnych błędów, będzie występować null błąd. Yes
└─ kod ciąg Jeden z server_error lub rate_limit_exceeded. No
└─ Komunikat ciąg Czytelny dla człowieka opis błędu. No
max_completion_tokens liczba całkowita Maksymalna liczba tokenów ukończenia określonych do użycia w trakcie przebiegu.
Yes
max_prompt_tokens liczba całkowita Maksymalna liczba tokenów monitów określonych do użycia w trakcie przebiegu.
Yes
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
Yes
model ciąg Model używany przez asystenta na potrzeby tego przebiegu. Yes
obiekt ciąg Typ obiektu, który jest zawsze thread.run. Yes
parallel_tool_calls ParallelToolCalls Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. No True
required_action obiekt Szczegółowe informacje na temat akcji wymaganej do kontynuowania przebiegu. Będzie to null , jeśli nie jest wymagana żadna akcja. Yes
└submit_tool_outputs obiekt Szczegółowe informacje na temat danych wyjściowych narzędzia potrzebnych do kontynuowania tego przebiegu. No
└tool_calls macierz Lista odpowiednich wywołań narzędzi. No
└typ wyliczenie Na razie jest to zawsze submit_tool_outputs.
Możliwe wartości: submit_tool_outputs
No
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
Yes
started_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu uruchomienia przebiegu. Yes
stan ciąg Stan przebiegu, który może mieć queuedwartość , , in_progress, requires_actioncancellingcancelledfailed, completedlub .expired Yes
temperature number Temperatura próbkowania używana na potrzeby tego przebiegu. Jeśli nie zostanie ustawiona, wartość domyślna to 1. No
thread_id ciąg Identyfikator wątków, na których zostało wykonane to uruchomienie. Yes
tool_choice assistantsApiToolChoiceOption Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie będzie wywoływać żadnych narzędzi i zamiast tego generuje komunikat.
auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.
Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
Yes
tools macierz Lista narzędzi używanych przez asystenta do tego przebiegu. Yes []
top_p number Wartość próbkowania jądra użyta na potrzeby tego przebiegu. Jeśli nie zostanie ustawiona, wartość domyślna to 1. No
truncation_strategy truncationObject Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. Yes
użycie runCompletionUsage Statystyki użycia związane z uruchomieniem. Ta wartość będzie taka null , jeśli przebieg nie znajduje się w stanie terminalu (np. in_progress, queueditp.). Yes

object Enum: runObjectType

Value Description
thread.run Typ obiektu przebiegu, który jest zawsze thread.run

status Enum: StatusUruchomieniaObiektu

Value Description
w kolejce Stan w kolejce
in_progress Stan in_progress
requires_action Stan required_action
cancelling Stan anulowania
cancelled Stan anulowany
failed Stan niepowodzenia
completed Stan ukończony
expired Stan wygasły

createRunRequest

Name Typ Description Required Default
additional_instructions ciąg Dołącza dodatkowe instrukcje na końcu instrukcji dotyczących przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów bez zastępowania innych instrukcji. No
additional_messages macierz Dodaje dodatkowe komunikaty do wątku przed utworzeniem przebiegu. No
assistant_id ciąg Identyfikator asystenta do wykonania tego przebiegu. Yes
instructions ciąg Zastąpi domyślny komunikat systemowy asystenta. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. No
max_completion_tokens liczba całkowita Maksymalna liczba tokenów ukończenia, które mogą być używane w trakcie przebiegu. Uruchomienie dokłada wszelkich starań, aby używać tylko określonej liczby tokenów ukończenia w wielu etapach uruchomienia. Jeśli przebieg przekroczy określoną liczbę tokenów ukończenia, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details.
No
max_prompt_tokens liczba całkowita Maksymalna liczba tokenów monitów, które mogą być używane w trakcie przebiegu. Przebieg dokłada wszelkich starań, aby używać tylko określonej liczby tokenów monitu podczas wielu cykli przebiegu. Jeśli przebieg przekroczy określoną liczbę tokenów monitu, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details.
No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
model ciąg Identyfikator modelu, który ma być używany do wykonania tego przebiegu. Jeśli w tym miejscu zostanie podana wartość, zastąpi ona model skojarzony z asystentem. Jeśli nie, zostanie użyty model skojarzony z asystentem. No
parallel_tool_calls ParallelToolCalls Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. No True
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
odtwarzać strumieniowo boolean Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] .
No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
No 1
tool_choice assistantsApiToolChoiceOption Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie będzie wywoływać żadnych narzędzi i zamiast tego generuje komunikat.
auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.
Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
No
tools macierz Zastąpić narzędzia, których asystent może użyć na potrzeby tego przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. No
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu.
No 1
truncation_strategy truncationObject Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. No

listRunsResponse

Name Typ Description Required Default
dane macierz Yes
first_id ciąg Yes
has_more boolean Yes
last_id ciąg Yes
obiekt ciąg Yes

modifyRunRequest

Name Typ Description Required Default
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No

submitToolOutputsRunRequest

Name Typ Description Required Default
odtwarzać strumieniowo boolean Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] .
No
tool_outputs macierz Lista narzędzi, dla których są przesyłane dane wyjściowe. Yes

runToolCallObject

Obiekty wywołania narzędzi

Name Typ Description Required Default
funkcja obiekt Definicja funkcji. Yes
└─ Argumenty ciąg Argumenty, które model oczekuje przekazania do funkcji. No
└─ nazwa ciąg Nazwa funkcji. No
id ciąg Identyfikator wywołania narzędzia. Ten identyfikator należy przywoływać podczas przesyłania wyników narzędzia przy użyciu funkcji przesyłania wyników do uruchomienia punktu końcowego. Yes
typ ciąg Typ narzędzia wywołującego dane wyjściowe jest wymagany. Na razie jest to zawsze function. Yes

Typ Enum: RunToolCallObjectType

Value Description
funkcja

createThreadAndRunRequest

Name Typ Description Required Default
assistant_id ciąg Identyfikator asystenta do wykonania tego przebiegu. Yes
instructions ciąg Zastąpi domyślny komunikat systemowy asystenta. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. No
max_completion_tokens liczba całkowita Maksymalna liczba tokenów ukończenia, które mogą być używane w trakcie przebiegu. Uruchomienie dokłada wszelkich starań, aby używać tylko określonej liczby tokenów ukończenia w wielu etapach uruchomienia. Jeśli przebieg przekroczy określoną liczbę tokenów ukończenia, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details.
No
max_prompt_tokens liczba całkowita Maksymalna liczba tokenów monitów, które mogą być używane w trakcie przebiegu. Przebieg dokłada wszelkich starań, aby używać tylko określonej liczby tokenów monitu podczas wielu cykli przebiegu. Jeśli przebieg przekroczy określoną liczbę tokenów monitu, przebieg zakończy się stanem incomplete. Aby uzyskać więcej informacji, zobacz incomplete_details.
No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
model ciąg Identyfikator modeli, które mają być wykorzystane do wykonania tego zadania. Jeśli w tym miejscu zostanie podana wartość, zastąpi ona model skojarzony z asystentem. Jeśli nie, zostanie użyty model skojarzony z asystentem. No
parallel_tool_calls ParallelToolCalls Czy włączyć równoległe wywoływanie funkcji podczas używania narzędzia. No True
response_format assistantsApiResponseFormatOption Określa format, który model musi wyświetlić. Zgodność z GPT-4o, GPT-4 Turbo i wszystkimi modelami GPT-3.5 Turbo od gpt-3.5-turbo-1106.

Ustawienie na { "type": "json_schema", "json_schema": {...} } umożliwia włączenie danych wyjściowych o strukturze, które zapewniają zgodność modelu z podanym schematem JSON. Dowiedz się więcej w przewodniku Dotyczącym danych wyjściowych ze strukturą.

Ustawienie w celu { "type": "json_object" } włączenia trybu JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON.

Ważne: w przypadku korzystania z trybu JSON należy również poinstruować model, aby samodzielnie wygenerował kod JSON za pośrednictwem komunikatu systemowego lub użytkownika. Bez tego model może wygenerować niekończący się strumień białych znaków, dopóki generowanie nie osiągnie limitu tokenu, co spowoduje długotrwałe i pozornie "zablokowane" żądanie. Należy również zauważyć, że zawartość wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generacja przekroczyła max_tokens lub jeśli rozmowa przekroczyła maksymalną długość kontekstu.
No
odtwarzać strumieniowo boolean Jeśli trueprogram zwraca strumień zdarzeń, które występują podczas zdarzeń Uruchom jako serwer, kończy się po wprowadzeniu stanu terminalu z komunikatem data: [DONE] .
No
stream_options chatCompletionStreamOptions Opcje strumieniowania odpowiedzi. Ustaw tę wartość tylko po ustawieniu stream: true.
No None
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
No 1
konwersacja createThreadRequest No
tool_choice assistantsApiToolChoiceOption Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.
none oznacza, że model nie będzie wywoływać żadnych narzędzi i zamiast tego generuje komunikat.
auto jest wartością domyślną i oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem narzędzia.
Określenie określonego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
No
tool_resources obiekt Zestaw zasobów używanych przez narzędzia asystenta. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Identyfikator magazynu wektorów dołączony do tego asystenta. Może istnieć maksymalnie 1 magazyn wektorów dołączony do asystenta.
No
tools macierz Zastąpić narzędzia, których asystent może użyć na potrzeby tego przebiegu. Jest to przydatne w przypadku modyfikowania zachowania dla poszczególnych przebiegów. No
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmianę tej wartości lub temperatury, ale nie obu.
No 1
truncation_strategy truncationObject Określa sposób obcinania wątku przed uruchomieniem. Służy do kontrolowania początkowego okna kontekstu przebiegu. No

threadObject

Reprezentuje wątek zawierający komunikaty.

Name Typ Description Required Default
created_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia wątku. Yes
id ciąg Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. Yes
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
Yes
obiekt ciąg Typ obiektu, który jest zawsze thread. Yes
tool_resources obiekt Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
Yes
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku.
No

object Enum: ThreadObjectType

Value Description
konwersacja Typ obiektu wątku, który jest zawsze thread

createThreadRequest

Name Typ Description Required Default
messages macierz Lista komunikatów, z których chcesz rozpocząć wątek. No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
tool_resources obiekt Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku.
No
└─ przechowalnie_wektorów macierz Pomocnik do tworzenia magazynu wektorów z file_ids i dołączania go do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku.
No

modifyThreadRequest

Name Typ Description Required Default
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
tool_resources obiekt Zestaw zasobów udostępnianych narzędziom asystenta w tym wątku. Zasoby są specyficzne dla typu narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, a file_search narzędzie wymaga listy identyfikatorów magazynów wektorów.
No
└ code_interpreter obiekt No
└ file_ids macierz Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Może istnieć maksymalnie 20 plików skojarzonych z narzędziem.
No []
└file_search obiekt No
└vector_store_ids macierz Magazyn wektorów dołączony do tego wątku. Może istnieć maksymalnie 1 magazyn wektorów dołączony do wątku.
No

deleteThreadResponse

Name Typ Description Required Default
deleted boolean Yes
id ciąg Yes
obiekt ciąg Yes

object Enum: DeleteThreadResponseObjectState

Value Description
thread.deleted Stan obiektu odpowiedzi usuwania wątku, który jest thread.deleted

listThreadsResponse

Name Typ Description Required Default
dane macierz Yes
first_id ciąg Yes
has_more boolean Yes
last_id ciąg Yes
obiekt ciąg Yes

messageObject

Reprezentuje wiadomość w ramach wątków.

Name Typ Description Required Default
assistant_id ciąg Jeśli ma to zastosowanie, identyfikator asystenta, który napisał tę wiadomość. Yes
attachments macierz Lista plików dołączonych do wiadomości i narzędzi, do których zostały dodane. Yes
completed_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu zakończenia komunikatu. Yes
zawartość macierz Zawartość wiadomości w tablicy tekstu i/lub obrazów. Yes
created_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia komunikatu. Yes
id ciąg Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. Yes
incomplete_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu, gdy komunikat został oznaczony jako niekompletny. Yes
incomplete_details obiekt W niekompletnej wiadomości szczegółowe informacje o tym, dlaczego wiadomość jest niekompletna. Yes
└* przyczyna ciąg Przyczyna, dla którego komunikat jest niekompletny. No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
Yes
obiekt ciąg Typ obiektu, który jest zawsze thread.message. Yes
rola ciąg Jednostka, która wygenerowała komunikat. Jeden z user lub assistant. Yes
run_id ciąg Jeśli ma to zastosowanie, identyfikator przebiegu skojarzonego z tworzeniem tego komunikatu. Yes
stan ciąg Stan komunikatu, który może mieć in_progresswartość , incompletelub completed. Yes
thread_id ciąg Identyfikator wątków, do którego należy ten komunikat. Yes

object Enum: TypObiektuWiadomości

Value Description
thread.message Typ obiektu komunikatu, który jest thread.message

Enum statusu: Status obiektu wiadomości

Value Description
in_progress
incomplete
completed

rola Enum: RolaObiektuWiadomości

Value Description
użytkownik
asystent

messageDeltaObject

Reprezentuje różnicę komunikatów, tj. wszystkie zmienione pola w wiadomości podczas przesyłania strumieniowego.

Name Typ Description Required Default
delta obiekt Delta zawierająca pola, które uległy zmianie w komunikacie. Yes
└─ zawartość macierz Zawartość wiadomości w tablicy tekstu i/lub obrazów. No
└─ Rola ciąg Jednostka, która wygenerowała komunikat. Jeden z user lub assistant. No
id ciąg Identyfikator komunikatu, do którego można się odwoływać w punktach końcowych interfejsu API. Yes
obiekt ciąg Typ obiektu, który jest zawsze thread.message.delta. Yes

obiekt Enum: MessageDeltaObjectType

Value Description
thread.message.delta

createMessageRequest

Name Typ Description Required Default
attachments macierz Lista plików dołączonych do wiadomości oraz narzędzia, do których należy je dodać. No
zawartość ciąg Zawartość wiadomości. Yes
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
rola ciąg Rola jednostki tworzącej komunikat. Dozwolone wartości obejmują:
- user: wskazuje, że komunikat jest wysyłany przez rzeczywistego użytkownika i powinien być używany w większości przypadków do reprezentowania komunikatów generowanych przez użytkownika.
- assistant: wskazuje, że komunikat jest generowany przez asystenta. Użyj tej wartości, aby wstawić wiadomości z asystenta do konwersacji.
Yes

role Enum: CreateMessageRequestRole

Value Description
użytkownik
asystent

modifyMessageRequest

Name Typ Description Required Default
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No

deleteMessageResponse

Name Typ Description Required Default
deleted boolean Yes
id ciąg Yes
obiekt ciąg Yes

object Enum: DeleteMessageResponseObject

Value Description
thread.message.deleted Stan obiektu odpowiedzi komunikatu usuwania

listMessagesResponse

Name Typ Description Required Default
dane macierz Yes
first_id ciąg Yes
has_more boolean Yes
last_id ciąg Yes
obiekt ciąg Yes

messageContentImageFileObject

Odwołuje się do pliku obrazu w zawartości komunikatu.

Name Typ Description Required Default
image_file obiekt Yes
└ file_id ciąg Identyfikator pliku obrazu w zawartości wiadomości. No
typ ciąg Zawsze image_file. Yes

type Enum: MessageContentImageFileObjectType

Value Description
image_file Typ pliku obrazu zawartości wiadomości

messageContentTextObject

Zawartość tekstowa, która jest częścią wiadomości.

Name Typ Description Required Default
SMS obiekt Yes
└* adnotacje macierz No
└─ wartość ciąg Dane tworzące tekst. No
typ ciąg Zawsze text. Yes

type Enum: TypObiektuTekstowegoTreściWiadomości

Value Description
SMS Typ obiektu zawartości wiadomości

messageContentTextAnnotationsFileCitationObject

Cytat w komunikacie wskazujący określony cudzysłów z określonego pliku skojarzonego z asystentem lub komunikatem. Generowane, gdy asystent używa narzędzia "pobieranie" do wyszukiwania plików.

Name Typ Description Required Default
end_index liczba całkowita Yes
file_citation obiekt Yes
└ file_id ciąg Identyfikator określonego pliku, z których pochodzi cytat. No
start_index liczba całkowita Yes
SMS ciąg Tekst w zawartości wiadomości, który musi zostać zastąpiony. Yes
typ ciąg Zawsze file_citation. Yes

typ Enum: FileCitationObjectType

Value Description
file_citation Typ obiektu cytatu pliku

messageContentTextAnnotationsFilePathObject

Adres URL pliku, który jest generowany, gdy asystent użył code_interpreter narzędzia do wygenerowania pliku.

Name Typ Description Required Default
end_index liczba całkowita Yes
file_path obiekt Yes
└ file_id ciąg Identyfikator wygenerowanego pliku. No
start_index liczba całkowita Yes
SMS ciąg Tekst w zawartości wiadomości, który musi zostać zastąpiony. Yes
typ ciąg Zawsze file_path. Yes

typ Enum: FilePathObjectType

Value Description
file_path Typ obiektu ścieżki pliku

messageDeltaContentImageFileObject

Odwołuje się do pliku obrazu w zawartości komunikatu.

Name Typ Description Required Default
image_file obiekt No
└ file_id ciąg Identyfikator pliku obrazu w zawartości wiadomości. No
indeks liczba całkowita Indeks części zawartości w komunikacie. Yes
typ ciąg Zawsze image_file. Yes

type Enum: MessageDeltaContentImageFileObjectType

Value Description
image_file

messageDeltaContentTextObject

Zawartość tekstowa, która jest częścią wiadomości.

Name Typ Description Required Default
indeks liczba całkowita Indeks części zawartości w komunikacie. Yes
SMS obiekt No
└* adnotacje macierz No
└─ wartość ciąg Dane tworzące tekst. No
typ ciąg Zawsze text. Yes

type Enum: MessageDeltaContentTextObjectType

Value Description
SMS

messageDeltaContentTextAnnotationsFileCitationObject

Cytat w komunikacie wskazujący określony cudzysłów z określonego pliku skojarzonego z asystentem lub komunikatem. Generowane, gdy asystent używa narzędzia "file_search" do wyszukiwania plików.

Name Typ Description Required Default
end_index liczba całkowita No
file_citation obiekt No
└ file_id ciąg Identyfikator określonego pliku, z których pochodzi cytat. No
└cudzysłów ciąg Konkretny cudzysłów w pliku. No
indeks liczba całkowita Indeks adnotacji w części zawartości tekstowej. Yes
start_index liczba całkowita No
SMS ciąg Tekst w zawartości wiadomości, który musi zostać zastąpiony. No
typ ciąg Zawsze file_citation. Yes

type Enum: MessageDeltaContentTextAnnotationsFileCitationObjectType

Value Description
file_citation

messageDeltaContentTextAnnotationsFilePathObject

Adres URL pliku, który jest generowany, gdy asystent użył code_interpreter narzędzia do wygenerowania pliku.

Name Typ Description Required Default
end_index liczba całkowita No
file_path obiekt No
└ file_id ciąg Identyfikator wygenerowanego pliku. No
indeks liczba całkowita Indeks adnotacji w części zawartości tekstowej. Yes
start_index liczba całkowita No
SMS ciąg Tekst w zawartości wiadomości, który musi zostać zastąpiony. No
typ ciąg Zawsze file_path. Yes

type Enum: MessageDeltaContentTextAnnotationsFilePathObjectType

Value Description
file_path

runStepObject

Reprezentuje krok wykonywania przebiegu.

Name Typ Description Required Default
assistant_id ciąg Identyfikator asystenta skojarzonego z krokiem uruchamiania. Yes
cancelled_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu anulowania kroku uruchamiania. Yes
completed_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu ukończenia kroku uruchamiania. Yes
created_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia kroku uruchamiania. Yes
expired_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla czasu wygaśnięcia kroku uruchamiania. Krok jest uznawany za wygasły, jeśli uruchomienie nadrzędne wygasło. Yes
failed_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu niepowodzenia kroku uruchamiania. Yes
id ciąg Identyfikator kroku uruchamiania, do którego można odwoływać się w punktach końcowych interfejsu API. Yes
last_error obiekt Ostatni błąd skojarzony z tym krokiem przebiegu. Jeśli nie ma żadnych błędów, będzie występować null błąd. Yes
└─ kod ciąg Jeden z server_error lub rate_limit_exceeded. No
└─ Komunikat ciąg Czytelny dla człowieka opis błędu. No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
Yes
obiekt ciąg Typ obiektu, który jest zawsze assistant.run.step. Yes
run_id ciąg Identyfikator przebiegu, którego dotyczy ten krok przebiegu, jest częścią. Yes
stan ciąg Stan przebiegu, który może mieć wartość in_progress, , cancelledfailed, completedlub expired. Yes
step_details runStepDetailsMessageCreationObject lub runStepDetailsToolCallsObject Szczegóły kroku uruchamiania. Yes
thread_id ciąg Identyfikator uruchomionych wątków. Yes
typ ciąg Typ kroku uruchamiania, który może mieć message_creation wartość lub tool_calls. Yes

object Enum: RunStepObjectType

Value Description
assistant.run.step Typ obiektu, który jest zawsze assistant.run.step

type Enum: RunStepObjectType

Value Description
message_creation Krok uruchamiania message_creation
tool_calls Krok uruchamiania tool_calls

Status Enum: RunStepObjectStatus

Value Description
in_progress Stan uruchomienia in_progress
cancelled Stan anulowanego uruchomienia
failed Stan anulowanego uruchomienia
completed Stan anulowanego uruchomienia
expired Stan anulowanego uruchomienia

runStepDeltaObject

Reprezentuje różnicę kroku uruchamiania, tj. wszelkie zmienione pola w kroku uruchamiania podczas przesyłania strumieniowego.

Name Typ Description Required Default
delta obiekt Delta zawierająca pola, które zostały zmienione w kroku uruchamiania. Yes
└─ szczegóły kroku runStepDeltaStepDetailsMessageCreationObject lub runStepDeltaStepDetailsToolCallsObject Szczegóły kroku uruchamiania. No
id ciąg Identyfikator kroku uruchamiania, do którego można odwoływać się w punktach końcowych interfejsu API. Yes
obiekt ciąg Typ obiektu, który jest zawsze thread.run.step.delta. Yes

object Enum: RunStepDeltaObjectType

Value Description
thread.run.step.delta

listRunStepsResponse

Name Typ Description Required Default
dane macierz Yes
first_id ciąg Yes
has_more boolean Yes
last_id ciąg Yes
obiekt ciąg Yes

runStepDetailsMessageCreationObject

Szczegółowe informacje o tworzeniu komunikatu w kroku uruchamiania.

Name Typ Description Required Default
message_creation obiekt Yes
└ message_id ciąg Identyfikator komunikatu, który został utworzony przez ten krok przebiegu. No
typ ciąg Zawsze message_creation. Yes

type Enum: Typ obiektu tworzenia wiadomości szczegółów kroku wykonania

Value Description
message_creation

runStepDeltaStepDetailsMessageCreationObject

Szczegółowe informacje o tworzeniu komunikatu w kroku uruchamiania.

Name Typ Description Required Default
message_creation obiekt No
└ message_id ciąg Identyfikator komunikatu, który został utworzony przez ten krok przebiegu. No
typ ciąg Zawsze message_creation. Yes

typ Enum: RunStepDeltaStepDetailsMessageCreationObjectType

Value Description
message_creation

runStepDetailsToolCallsObject

Szczegóły wywołania narzędzia.

Name Typ Description Required Default
tool_calls macierz Tablica narzędzi wywołuje krok uruchamiania. Mogą one być skojarzone z jednym z trzech typów narzędzi: code_interpreter, retrieval lub function.
Yes
typ ciąg Zawsze tool_calls. Yes

type Enum: RunStepDetailsToolCallsObjectType

Value Description
tool_calls

runStepDeltaStepDetailsToolCallsObject

Szczegóły wywołania narzędzia.

Name Typ Description Required Default
tool_calls macierz Tablica narzędzi wywołuje krok uruchamiania. Mogą one być skojarzone z jednym z trzech typów narzędzi: code_interpreter, file_search lub function.
No
typ ciąg Zawsze tool_calls. Yes

type Enum: RunStepDeltaStepDetailsToolCallsObjectType

Value Description
tool_calls

runStepDetailsToolCallsCodeObject

Szczegóły narzędzia interpretera kodu, w ramach którego był zaangażowany krok uruchamiania.

Name Typ Description Required Default
code_interpreter obiekt Definicja wywołania narzędzia Interpreter kodu. Yes
└─ Wejście ciąg Dane wejściowe wywołania narzędzia Interpreter kodu. No
Dane wyjściowe └} macierz Dane wyjściowe wywołania narzędzia Interpreter kodu. Interpreter kodu może wyświetlać co najmniej jeden element, w tym tekst (logs) lub obrazy (image). Każdy z nich jest reprezentowany przez inny typ obiektu. No
id ciąg Identyfikator wywołania narzędzia. Yes
typ ciąg Typ wywołania narzędzia. To zawsze będzie code_interpreter dotyczyć tego typu wywołania narzędzia. Yes

type Enum: RunStepDetailsToolCallsCodeObjectType

Value Description
code_interpreter

runStepDeltaStepDetailsToolCallsCodeObject

Szczegóły narzędzia interpretera kodu, w ramach którego był zaangażowany krok uruchamiania.

Name Typ Description Required Default
code_interpreter obiekt Definicja wywołania narzędzia Interpreter kodu. No
└─ Wejście ciąg Dane wejściowe wywołania narzędzia Interpreter kodu. No
Dane wyjściowe └} macierz Dane wyjściowe wywołania narzędzia Interpreter kodu. Interpreter kodu może wyświetlać co najmniej jeden element, w tym tekst (logs) lub obrazy (image). Każdy z nich jest reprezentowany przez inny typ obiektu. No
id ciąg Identyfikator wywołania narzędzia. No
indeks liczba całkowita Indeks wywołania narzędzia w narzędziu wywołuje tablicę. Yes
typ ciąg Typ wywołania narzędzia. To zawsze będzie code_interpreter dotyczyć tego typu wywołania narzędzia. Yes

typ wyliczeniowy Enum: RunStepDeltaStepDetailsToolCallsCodeObjectType

Value Description
code_interpreter

runStepDetailsToolCallsCodeOutputLogsObject

Dane wyjściowe tekstu z wywołania narzędzia Interpreter kodu w ramach kroku uruchamiania.

Name Typ Description Required Default
dzienniki ciąg Dane wyjściowe tekstu z wywołania narzędzia Interpreter kodu. Yes
typ ciąg Zawsze logs. Yes

Typ Enum: RunStepDetailsToolCallsCodeOutputLogsObjectType

Value Description
dzienniki

runStepDeltaStepDetailsToolCallsCodeOutputLogsObject

Dane wyjściowe tekstu z wywołania narzędzia Interpreter kodu w ramach kroku uruchamiania.

Name Typ Description Required Default
indeks liczba całkowita Indeks danych wyjściowych w tablicy danych wyjściowych. Yes
dzienniki ciąg Dane wyjściowe tekstu z wywołania narzędzia Interpreter kodu. No
typ ciąg Zawsze logs. Yes

Step 2: Typ wyliczeniowy: Obiekt typu RunStepDeltaStepDetailsToolCallsCodeOutputLogs

Value Description
dzienniki

runStepDetailsToolCallsCodeOutputImageObject

Name Typ Description Required Default
obraz obiekt Yes
└ file_id ciąg Identyfikator pliku obrazu. No
typ ciąg Zawsze image. Yes

type Enum: RunStepDetailsToolCallsCodeOutputImageObjectType

Value Description
obraz

runStepDeltaStepDetailsToolCallsCodeOutputImageObject

Name Typ Description Required Default
obraz obiekt No
└ file_id ciąg Identyfikator pliku obrazu. No
indeks liczba całkowita Indeks danych wyjściowych w tablicy danych wyjściowych. Yes
typ ciąg Zawsze image. Yes

typ Enum: RunStepDeltaStepDetailsNarzędziaWywołaniaKodWynikowyObiektGraficzny

Value Description
obraz

runStepDetailsToolCallsFileSearchObject

Name Typ Description Required Default
file_search obiekt Na razie zawsze będzie to pusty obiekt. Yes
Wyniki └} macierz Wyniki wyszukiwania plików. No
id ciąg Identyfikator obiektu wywołania narzędzia. Yes
typ ciąg Typ wywołania narzędzia. To zawsze będzie file_search dotyczyć tego typu wywołania narzędzia. Yes

type Enum: RunStepDetailsToolCallsFileSearchObjectType

Value Description
file_search

runStepDetailsToolCallsFileSearchResultObject

Wystąpienie wyników wyszukiwania plików.

Name Typ Description Required Default
zawartość macierz Zawartość znalezionego wyniku. Zawartość jest dołączana tylko w przypadku żądania za pośrednictwem parametru include zapytania. No
file_id ciąg Identyfikator pliku, w ramach którego znaleziono wynik. Yes
file_name ciąg Nazwa pliku, w ramach którego znaleziono wynik. Yes
wynik number Wynik. Wszystkie wartości muszą być liczbą zmiennoprzecinkową z zakresu od 0 do 1. Yes

runStepDeltaStepDetailsToolCallsFileSearchObject

Name Typ Description Required Default
file_search obiekt Na razie zawsze będzie to pusty obiekt. Yes
id ciąg Identyfikator obiektu wywołania narzędzia. No
indeks liczba całkowita Indeks wywołania narzędzia w narzędziu wywołuje tablicę. Yes
typ ciąg Typ wywołania narzędzia. To zawsze będzie retrieval dotyczyć tego typu wywołania narzędzia. Yes

type Enum: RunStepDeltaStepDetailsToolCallsFileSearchObjectType

Value Description
file_search

runStepDetailsToolCallsFunctionObject

Name Typ Description Required Default
funkcja obiekt Definicja funkcji, która została wywołana. Yes
└─ Argumenty ciąg Argumenty przekazane do funkcji. No
└─ nazwa ciąg Nazwa funkcji. No
└─ Dane wyjściowe ciąg Dane wyjściowe funkcji. Będzie to miało wartość null , jeśli dane wyjściowe nie zostały jeszcze przesłane. No
id ciąg Identyfikator obiektu wywołania narzędzia. Yes
typ ciąg Typ wywołania narzędzia. To zawsze będzie function dotyczyć tego typu wywołania narzędzia. Yes

type Enum: RunStepDetailsToolCallsFunctionObjectType

Value Description
funkcja

runStepDeltaStepDetailsToolCallsFunctionObject

Name Typ Description Required Default
funkcja obiekt Definicja funkcji, która została wywołana. No
└─ Argumenty ciąg Argumenty przekazane do funkcji. No
└─ nazwa ciąg Nazwa funkcji. No
└─ Dane wyjściowe ciąg Dane wyjściowe funkcji. Będzie to miało wartość null , jeśli dane wyjściowe nie zostały jeszcze przesłane. No
id ciąg Identyfikator obiektu wywołania narzędzia. No
indeks liczba całkowita Indeks wywołania narzędzia w narzędziu wywołuje tablicę. Yes
typ ciąg Typ wywołania narzędzia. To zawsze będzie function dotyczyć tego typu wywołania narzędzia. Yes

type Enum: RunStepDetailsToolCallsFunctionObjectType

Value Description
funkcja

vectorStoreExpirationAfter

Zasady wygasania magazynu wektorów.

Name Typ Description Required Default
kotwica ciąg Znacznik czasu zakotwiczenia, po którym mają zastosowanie zasady wygasania. Obsługiwane kotwice: last_active_at. Yes
days liczba całkowita Liczba dni po upływie czasu zakotwiczenia, przez który magazyn wektorów wygaśnie. Yes

anchor Enum: VectorStoreExpirationAfterAnchor

Value Description
last_active_at Znacznik czasu zakotwiczenia, po którym mają zastosowanie zasady wygasania.

vectorStoreObject

Magazyn wektorów to kolekcja przetworzonych plików może być używana przez file_search narzędzie.

Name Typ Description Required Default
created_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia magazynu wektorów. Yes
expires_after vectorStoreExpirationAfter Zasady wygasania magazynu wektorów. No
expires_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla czasu wygaśnięcia magazynu wektorów. No
file_counts obiekt Yes
└* anulowano liczba całkowita Liczba anulowanych plików. No
└─ Ukończono liczba całkowita Liczba plików, które zostały pomyślnie przetworzone. No
└* nie powiodło się liczba całkowita Liczba plików, które nie mogły przetworzyć. No
└─ w_toku liczba całkowita Liczba obecnie przetwarzanych plików. No
└─ suma liczba całkowita Całkowita liczba plików. No
id ciąg Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. Yes
last_active_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla czasu ostatniego aktywnego magazynu wektorów. Yes
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
Yes
name ciąg Nazwa magazynu wektorów. Yes
obiekt wyliczenie Typ obiektu, który jest zawsze vector_store.
Możliwe wartości: vector_store
Yes
stan ciąg Stan magazynu wektorów, który może mieć expiredwartość , in_progresslub completed. Stan completed wskazuje, że magazyn wektorów jest gotowy do użycia. Yes
usage_bytes liczba całkowita Całkowita liczba bajtów używanych przez pliki w magazynie wektorów. Yes

status Enum: VectorStoreObjectStatus

Value Description
expired
in_progress
completed

createVectorStoreRequest

Name Typ Description Required Default
chunking_strategy autoChunkingStrategyRequestParam lub staticChunkingStrategyRequestParam Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. Dotyczy tylko wtedy, gdy file_ids nie jest pusty. No
expires_after vectorStoreExpirationAfter Zasady wygasania magazynu wektorów. No
file_ids macierz Lista identyfikatorów plików, których powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
name ciąg Nazwa magazynu wektorów. No

updateVectorStoreRequest

Name Typ Description Required Default
expires_after vectorStoreExpirationAfter Zasady wygasania magazynu wektorów. No
metadane obiekt Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym. Klucze mogą mieć długość maksymalnie 64 znaków, a wartości mogą mieć długość maksymalnie 512 znaków.
No
name ciąg Nazwa magazynu wektorów. No

listVectorStoresResponse

Name Typ Description Required Default
dane macierz Yes
first_id ciąg Yes
has_more boolean Yes
last_id ciąg Yes
obiekt ciąg Yes

deleteVectorStoreResponse

Name Typ Description Required Default
deleted boolean Yes
id ciąg Yes
obiekt ciąg Yes

object Enum: DeleteVectorStoreResponseObject

Value Description
vector_store.deleted Stan obiektu odpowiedzi magazynu wektorów usuwania

vectorStoreFileObject

Lista plików dołączonych do magazynu wektorów.

Name Typ Description Required Default
chunking_strategy autoChunkingStrategyRequestParam lub staticChunkingStrategyRequestParam Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. Dotyczy tylko wtedy, gdy file_ids nie jest pusty. No
created_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia pliku magazynu wektorów. Yes
id ciąg Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. Yes
last_error obiekt Ostatni błąd skojarzony z tym plikiem magazynu wektorów. Jeśli nie ma żadnych błędów, będzie występować null błąd. Yes
└─ kod ciąg Jeden z server_error lub lub invalid_fileunsupported_file . No
└─ Komunikat ciąg Czytelny dla człowieka opis błędu. No
obiekt ciąg Typ obiektu, który jest zawsze vector_store.file. Yes
stan ciąg Stan pliku magazynu wektorów, który może mieć in_progresswartość , , completedcancelledlub failed. Stan completed wskazuje, że plik magazynu wektorów jest gotowy do użycia. Yes
usage_bytes liczba całkowita Łączne użycie magazynu wektorów w bajtach. Należy pamiętać, że może się to różnić od oryginalnego rozmiaru pliku. Yes
vector_store_id ciąg Identyfikator magazynu wektorów, do którego jest dołączony plik. Yes

obiekt Enum: VectorStoreFileObjectType

Value Description
vector_store.file

Status Enum: VectorStoreFileObjectStatus

Value Description
in_progress
completed
cancelled
failed

otherChunkingStrategyResponseParam

Jest to zwracane, gdy strategia fragmentowania jest nieznana. Zazwyczaj jest to spowodowane tym, że plik został zaindeksowany przed wprowadzeniem chunking_strategy koncepcji w interfejsie API.

Name Typ Description Required Default
typ ciąg Zawsze other. Yes

typ Enum: OtherChunkingStrategyResponseParamType

Value Description
other

staticChunkingStrategyResponseParam

Name Typ Description Required Default
statyczny staticChunkingStrategy Yes
typ ciąg Zawsze static. Yes

typ Enum: StaticChunkingStrategyResponseParamType

Value Description
statyczny

staticChunkingStrategy

Name Typ Description Required Default
chunk_overlap_tokens liczba całkowita Liczba tokenów nakładających się między fragmentami. Wartość domyślna to 400.

Należy pamiętać, że nakładanie się nie może przekraczać połowy wartości max_chunk_size_tokens.
Yes
max_chunk_size_tokens liczba całkowita Maksymalna liczba tokenów w każdym kawałku. Wartość domyślna to 800. Wartość minimalna to 100 , a wartość maksymalna to 4096. Yes

autoChunkingStrategyRequestParam

Strategia domyślna. Ta strategia używa obecnie wartości max_chunk_size_tokens800 i chunk_overlap_tokens .400

Name Typ Description Required Default
typ wyliczenie Zawsze auto.
Możliwe wartości: auto
Yes

staticChunkingStrategyRequestParam

Name Typ Description Required Default
statyczny staticChunkingStrategy Yes
typ wyliczenie Zawsze static.
Możliwe wartości: static
Yes

chunkingStrategyRequestParam

Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii.

Ten składnik może być jednym z następujących elementów:

createVectorStoreFileRequest

Name Typ Description Required Default
chunking_strategy chunkingStrategyRequestParam Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. No
file_id ciąg Identyfikator pliku, którego powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. Yes

listVectorStoreFilesResponse

Name Typ Description Required Default
dane macierz Yes
first_id ciąg Yes
has_more boolean Yes
last_id ciąg Yes
obiekt ciąg Yes

deleteVectorStoreFileResponse

Name Typ Description Required Default
deleted boolean Yes
id ciąg Yes
obiekt ciąg Yes

object Enum: DeleteVectorStoreFileResponseObject

Value Description
vector_store.file.deleted

vectorStoreFileBatchObject

Partia plików dołączonych do magazynu wektorów.

Name Typ Description Required Default
created_at liczba całkowita Sygnatura czasowa systemu Unix (w sekundach) dla momentu utworzenia partii plików magazynu wektorów. Yes
file_counts obiekt Yes
└* anulowano liczba całkowita Liczba anulowanych plików. No
└─ Ukończono liczba całkowita Liczba przetworzonych plików. No
└* nie powiodło się liczba całkowita Liczba plików, które nie mogły przetworzyć. No
└─ w_toku liczba całkowita Liczba obecnie przetwarzanych plików. No
└─ suma liczba całkowita Całkowita liczba plików. No
id ciąg Identyfikator, do którego można odwoływać się w punktach końcowych interfejsu API. Yes
obiekt ciąg Typ obiektu, który jest zawsze vector_store.file_batch. Yes
stan ciąg Stan partii plików magazynu wektorów, który może mieć in_progresswartość , completedcancelled lub failed. Yes
vector_store_id ciąg Identyfikator magazynu wektorów, do którego jest dołączony plik. Yes

obiekt Enum: VectorStoreFileBatchObjectType

Value Description
vector_store.files_batch

status Enum: VectorStoreFileBatchObjectStatus

Value Description
in_progress
completed
cancelled
failed

createVectorStoreFileBatchRequest

Name Typ Description Required Default
chunking_strategy chunkingStrategyRequestParam Strategia fragmentowania używana do fragmentowania plików. Jeśli nie zostanie ustawiona, użyje auto strategii. No
file_ids macierz Lista identyfikatorów plików, których powinien używać magazyn wektorów. Przydatne w przypadku narzędzi, takich jak file_search te, które mogą uzyskiwać dostęp do plików. Yes

assistantStreamEvent

Reprezentuje zdarzenie emitowane podczas przesyłania strumieniowego przebiegu.

Każde zdarzenie w strumieniu zdarzeń wysyłanych przez serwer ma event właściwość i :data

event: thread.created
data: {"id": "thread_123", "object": "thread", ...}

Emitujemy zdarzenia za każdym razem, gdy tworzony jest nowy obiekt, przechodzi do nowego stanu lub jest przesyłany strumieniowo w częściach (różnice). Na przykład emitujemy thread.run.created po utworzeniu nowego przebiegu, thread.run.completed po zakończeniu przebiegu itd. Gdy Asystent zdecyduje się utworzyć komunikat podczas przebiegu, emitujemy thread.message.created eventzdarzenie , thread.message.in_progress wiele thread.message.delta zdarzeń i na thread.message.completed koniec zdarzenie.

Możemy dodać dodatkowe zdarzenia w czasie, dlatego zalecamy bezproblemowe obsługę nieznanych zdarzeń w kodzie.

Ten składnik może być jednym z następujących elementów:

threadStreamEvent

Ten składnik może być jednym z następujących elementów:

thread.created

Występuje po utworzeniu nowego wątku.

Name Typ Description Required Default
dane threadObject Reprezentuje wątek zawierający komunikaty. Yes
wydarzenie ciąg Yes

Dane: threadObject

Wyliczenie zdarzeń: ThreadStreamEventEnum

Value Description
thread.created Zdarzenie utworzone przez wątek

runStreamEvent

Ten składnik może być jednym z następujących elementów:

thread.run.created

Występuje po utworzeniu nowego przebiegu.

Name Typ Description Required Default
dane runObject Reprezentuje przebieg wykonywania w wątkach. Yes
wydarzenie ciąg Yes

Dane: runObject

Wyliczenie zdarzeń: RunStreamEventCreated

Value Description
thread.run.created

thread.run.queued

Występuje, gdy przebieg przechodzi do queued stanu.

Name Typ Description Required Default
dane runObject Reprezentuje przebieg wykonywania w wątkach. Yes
wydarzenie ciąg Yes

Dane: runObject

Wyliczenie zdarzeń: RunStreamEventQueued

Value Description
thread.run.queued

thread.run.in_progress

Występuje, gdy przebieg przechodzi do in_progress stanu.

Name Typ Description Required Default
dane runObject Reprezentuje przebieg wykonywania w wątkach. Yes
wydarzenie ciąg Yes

Dane: runObject

Wyliczenie zdarzeń: RunStreamEventInProgress

Value Description
thread.run.in_progress

thread.run.requires_action

Występuje, gdy przebieg przechodzi do requires_action stanu.

Name Typ Description Required Default
dane runObject Reprezentuje przebieg wykonywania w wątkach. Yes
wydarzenie ciąg Yes

Dane: runObject

Wyliczenie zdarzeń: RunStreamEventRequiresAction

Value Description
thread.run.requires_action

thread.run.completed

Występuje po zakończeniu przebiegu.

Name Typ Description Required Default
dane runObject Reprezentuje przebieg wykonywania w wątkach. Yes
wydarzenie ciąg Yes

Dane: runObject

Wyliczenie zdarzeń: RunStreamEventCompleted

Value Description
thread.run.completed

thread.run.failed

Występuje, gdy uruchomienie zakończy się niepowodzeniem.

Name Typ Description Required Default
dane runObject Reprezentuje przebieg wykonywania w wątkach. Yes
wydarzenie ciąg Yes

Dane: runObject

Wyliczenie zdarzeń: RunStreamEventFailed

Value Description
thread.run.failed

thread.run.cancelling

Występuje, gdy przebieg przechodzi do cancelling stanu.

Name Typ Description Required Default
dane runObject Reprezentuje przebieg wykonywania w wątkach. Yes
wydarzenie ciąg Yes

Dane: runObject

Wyliczenie zdarzeń: RunStreamEventCancelling

Value Description
thread.run.cancelling

thread.run.cancelled

Występuje po anulowaniu przebiegu.

Name Typ Description Required Default
dane runObject Reprezentuje przebieg wykonywania w wątkach. Yes
wydarzenie ciąg Yes

Dane: runObject

Wyliczenie zdarzeń: RunStreamEventCancelled

Value Description
thread.run.cancelled

thread.run.expired

Występuje po wygaśnięciu przebiegu.

Name Typ Description Required Default
dane runObject Reprezentuje przebieg wykonywania w wątkach. Yes
wydarzenie ciąg Yes

Dane: runObject

Wyliczenie zdarzeń: RunStreamEventExpired

Value Description
thread.run.expired

runStepStreamEvent

Ten składnik może być jednym z następujących elementów:

thread.run.step.created

Występuje po utworzeniu kroku uruchamiania.

Name Typ Description Required Default
dane runStepObject Reprezentuje krok wykonywania przebiegu.
Yes
wydarzenie ciąg Yes

Dane: runStepObject

Wyliczenie zdarzeń: RunStepStreamEventCreated

Value Description
thread.run.step.created

thread.run.step.in_progress

Występuje, gdy krok uruchomienia przechodzi do in_progress stanu.

Name Typ Description Required Default
dane runStepObject Reprezentuje krok wykonywania przebiegu.
Yes
wydarzenie ciąg Yes

Dane: runStepObject

Wyliczenie zdarzeń: RunStepStreamEventInProgress

Value Description
thread.run.step.in_progress

thread.run.step.delta

Występuje, gdy są przesyłane strumieniowo części kroku uruchamiania.

Name Typ Description Required Default
dane runStepDeltaObject Reprezentuje różnicę kroku uruchamiania, tj. wszelkie zmienione pola w kroku uruchamiania podczas przesyłania strumieniowego.
Yes
wydarzenie ciąg Yes

Dane: runStepDeltaObject

Wyliczenie zdarzeń: RunStepStreamEventDelta

Value Description
thread.run.step.delta

thread.run.step.completed

Występuje po zakończeniu kroku uruchamiania.

Name Typ Description Required Default
dane runStepObject Reprezentuje krok wykonywania przebiegu.
Yes
wydarzenie ciąg Yes

Dane: runStepObject

Wyliczenie zdarzeń: RunStepStreamEventCompleted

Value Description
thread.run.step.completed

thread.run.step.failed

Występuje, gdy krok uruchomienia zakończy się niepowodzeniem.

Name Typ Description Required Default
dane runStepObject Reprezentuje krok wykonywania przebiegu.
Yes
wydarzenie ciąg Yes

Dane: runStepObject

Wyliczenie zdarzenia: RunStepStreamEventFailed

Value Description
thread.run.step.failed

thread.run.step.cancelled

Występuje, gdy krok uruchomienia zostanie anulowany.

Name Typ Description Required Default
dane runStepObject Reprezentuje krok wykonywania przebiegu.
Yes
wydarzenie ciąg Yes

Dane: runStepObject

Wyliczenie zdarzeń: RunStepStreamEventCancelled

Value Description
thread.run.step.cancelled

thread.run.step.expired

Występuje, gdy krok uruchomienia wygaśnie.

Name Typ Description Required Default
dane runStepObject Reprezentuje krok wykonywania przebiegu.
Yes
wydarzenie ciąg Yes

Dane: runStepObject

Wyliczenie zdarzeń: RunStepStreamEventExpired

Value Description
thread.run.step.expired

messageStreamEvent

Ten składnik może być jednym z następujących elementów:

thread.message.created

Występuje po utworzeniu komunikatu.

Name Typ Description Required Default
dane messageObject Reprezentuje wiadomość w ramach wątków. Yes
wydarzenie ciąg Yes

Dane: messageObject

Wyliczenie zdarzeń: MessageStreamEventCreated

Value Description
thread.message.created

thread.message.in_progress

Występuje, gdy komunikat przechodzi do in_progress stanu.

Name Typ Description Required Default
dane messageObject Reprezentuje wiadomość w ramach wątków. Yes
wydarzenie ciąg Yes

Dane: messageObject

Wyliczenie zdarzeń: MessageStreamEventInProgress

Value Description
thread.message.in_progress

thread.message.delta

Występuje, gdy są przesyłane strumieniowo części komunikatu.

Name Typ Description Required Default
dane messageDeltaObject Reprezentuje różnicę komunikatów, tj. wszystkie zmienione pola w wiadomości podczas przesyłania strumieniowego.
Yes
wydarzenie ciąg Yes

Dane: messageDeltaObject

Wyliczenie zdarzeń: MessageStreamEventDelta

Value Description
thread.message.delta

thread.message.completed

Występuje po zakończeniu komunikatu.

Name Typ Description Required Default
dane messageObject Reprezentuje wiadomość w ramach wątków. Yes
wydarzenie ciąg Yes

Dane: messageObject

Wyliczenie zdarzeń: MessageStreamEventCompleted

Value Description
thread.message.completed

thread.message.incomplete

Występuje, gdy komunikat kończy się przed jego ukończeniem.

Name Typ Description Required Default
dane messageObject Reprezentuje wiadomość w ramach wątków. Yes
wydarzenie ciąg Yes

Dane: messageObject

Wyliczenie zdarzeń: MessageStreamEventIncomplete

Value Description
thread.message.incomplete

Annotation

Ten składnik może być jednym z następujących elementów:

Click

Akcja kliknięcia.

Name Typ Description Required Default
button wyliczenie Wskazuje, który przycisk myszy został naciśnięty podczas kliknięcia. leftJeden z , right, wheel, back, lub forward.

Możliwe wartości: left, , rightwheel, , backforward
Yes
typ wyliczenie Określa typ zdarzenia. W przypadku akcji kliknięcia ta właściwość jest zawsze ustawiona na click.

Możliwe wartości: click
Yes
x liczba całkowita Współrzędna x, w której wystąpiło kliknięcie.
Yes
y liczba całkowita Współrzędna y, w której wystąpiło kliknięcie.
Yes

CodeInterpreterFileOutput

Dane wyjściowe wywołania narzędzia interpretera kodu, które jest plikiem.

Name Typ Description Required Default
files macierz Yes
typ wyliczenie Typ danych wyjściowych pliku interpretera kodu. Zawsze files.

Możliwe wartości: files
Yes

CodeInterpreterTextOutput

Dane wyjściowe wywołania narzędzia interpretera kodu, które jest tekstem.

Name Typ Description Required Default
dzienniki ciąg Dzienniki wywołania narzędzia interpretera kodu.
Yes
typ wyliczenie Typ danych wyjściowych tekstu interpretera kodu. Zawsze logs.

Możliwe wartości: logs
Yes

CodeInterpreterTool

Narzędzie, które uruchamia kod.

Name Typ Description Required Default
file_ids macierz Identyfikatory plików do uruchomienia kodu.
Yes
typ wyliczenie Typ narzędzia interpretera kodu. Zawsze code_interpreter.

Możliwe wartości: code_interpreter
Yes

CodeInterpreterToolCall

Wywołanie narzędzia w celu uruchomienia kodu.

Name Typ Description Required Default
kod ciąg Kod do uruchomienia.
Yes
id ciąg Unikatowy identyfikator wywołania narzędzia interpretera kodu.
Yes
results macierz Wyniki wywołania narzędzia interpretera kodu.
Yes
stan wyliczenie Stan wywołania narzędzia interpretera kodu.

Możliwe wartości: in_progress, , interpretingcompleted
Yes
typ wyliczenie Typ wywołania narzędzia interpretera kodu. Zawsze code_interpreter_call.

Możliwe wartości: code_interpreter_call
Yes

CodeInterpreterToolOutput

Ten składnik może być jednym z następujących elementów:

ComparisonFilter

Filtr używany do porównywania określonego klucza atrybutu z daną wartością przy użyciu zdefiniowanej operacji porównania.

Name Typ Description Required Default
klucz ciąg Klucz do porównania z wartością. Yes
typ wyliczenie Określa operator porównania: eq, , ne, gtgte, lt, . lte
- eq:Equals
- ne: nie równa się
- gt: większe niż
- gte: większe niż lub równe
- lt: mniejsze niż
- lte: mniejsze niż lub równe

Możliwe wartości: eq, , negt, gte, , ltlte
Yes
value ciąg lub liczba lub wartość logiczna Wartość do porównania z kluczem atrybutu; obsługuje typy ciągów, liczb lub wartości logicznych. Yes

CompoundFilter

Połącz wiele filtrów przy użyciu polecenia and lub or.

Name Typ Description Required Default
filters macierz Tablica filtrów do połączenia. Elementy mogą mieć wartość ComparisonFilter lub CompoundFilter. Yes
typ wyliczenie Typ operacji: and lub or.
Możliwe wartości: and, or
Yes

ComputerAction

Ten składnik może być jednym z następujących elementów:

ComputerScreenshotImage

Obraz zrzutu ekranu komputera używany w narzędziu do obsługi komputera.

Name Typ Description Required Default
file_id ciąg Identyfikator przekazanego pliku zawierającego zrzut ekranu. No
image_url ciąg Adres URL obrazu zrzutu ekranu. No
typ wyliczenie Określa typ zdarzenia. W przypadku zrzutu ekranu komputera ta właściwość jest zawsze ustawiona na computer_screenshot.

Możliwe wartości: computer_screenshot
Yes

ComputerTool

Narzędzie kontrolujące komputer wirtualny.

Name Typ Description Required Default
display_height number Wysokość wyświetlacza komputera.
Yes
display_width number Szerokość ekranu komputera.
Yes
środowisko wyliczenie Typ środowiska komputera do sterowania.

Możliwe wartości: mac, , windows, ubuntubrowser
Yes
typ wyliczenie Typ narzędzia do użycia komputera. Zawsze computer_use_preview.

Możliwe wartości: computer-use-preview
Yes

ComputerToolCall

Narzędzie wywołujące narzędzie do korzystania z komputera.

Name Typ Description Required Default
akcja ComputerAction Yes
call_id ciąg Identyfikator używany podczas odpowiadania na wywołanie narzędzia z danymi wyjściowymi.
Yes
id ciąg Unikatowy identyfikator wywołania komputera. Yes
pending_safety_checks macierz Oczekujące kontrole bezpieczeństwa dla wywołania komputera.
Yes
stan wyliczenie Stan elementu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
Yes
typ wyliczenie Typ wywołania komputera. Zawsze computer_call.
Możliwe wartości: computer_call
Yes

ComputerToolCallOutput

Dane wyjściowe z wywołania narzędzia komputerowego.

Name Typ Description Required Default
acknowledged_safety_checks macierz Kontrole bezpieczeństwa, które zostały zgłoszone przez interfejs API i potwierdzone przez dewelopera.
No
call_id ciąg Identyfikator wywołania narzędzia komputerowego, które wygenerowało dane wyjściowe.
Yes
id ciąg Identyfikator wyniku wywołania komputerowego narzędzia.
No
We/Wy ComputerScreenshotImage Obraz zrzutu ekranu komputera używany w narzędziu do obsługi komputera.
Yes
stan wyliczenie Stan danych wejściowych komunikatu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy wejściowe są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
No
typ wyliczenie Typ danych wyjściowych wywołania narzędzia komputerowego. Zawsze computer_call_output.

Możliwe wartości: computer_call_output
Yes

ComputerToolCallOutputResource

Name Typ Description Required Default
acknowledged_safety_checks macierz Kontrole bezpieczeństwa, które zostały zgłoszone przez interfejs API i potwierdzone przez dewelopera.
No
call_id ciąg Identyfikator wywołania narzędzia komputerowego, które wygenerowało dane wyjściowe.
Yes
id ciąg Unikatowy identyfikator danych wyjściowych narzędzia do wywołań komputerowych.
Yes
We/Wy ComputerScreenshotImage Obraz zrzutu ekranu komputera używany w narzędziu do obsługi komputera.
Yes
stan wyliczenie Stan danych wejściowych komunikatu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy wejściowe są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
No
typ wyliczenie Typ danych wyjściowych wywołania narzędzia komputerowego. Zawsze computer_call_output.

Możliwe wartości: computer_call_output
Yes

ComputerToolCallSafetyCheck

Zaplanowana kontrola bezpieczeństwa dla komputerowego wezwania.

Name Typ Description Required Default
kod ciąg Typ oczekującego sprawdzenia bezpieczeństwa. Yes
id ciąg Identyfikator oczekującego sprawdzenia bezpieczeństwa. Yes
komunikat ciąg Szczegółowe informacje na temat nadchodzących kontroli bezpieczeństwa. Yes

Content

Zawartość danych wejściowych i wyjściowych wielomodalnych.

Ten składnik może być jednym z następujących elementów:

Coordinate

Para współrzędnych x/y, np. { x: 100, y: 200 }.

Name Typ Description Required Default
x liczba całkowita Współrzędna x.
Yes
y liczba całkowita Współrzędna y.
Yes

CreateModelResponseProperties

Name Typ Description Required Default
metadane Metadata Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego.

Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków.
No
model ciąg Model używany do generowania odpowiedzi. No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie.
No 1
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie.
No 1
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc usłudze OpenAI w monitorowaniu i wykrywaniu nadużyć. .
No

createResponse

Name Typ Description Required Default
include macierz {"$ref": "#/components/schemas/includable/description"} No
dane wejściowe ciąg lub tablica Dane wejściowe tekstu, obrazu lub pliku w modelu używane do generowania odpowiedzi. Yes
instructions ciąg Wstawia komunikat systemu (lub dewelopera) jako pierwszy element w kontekście modelu.

Podczas używania previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia proste wymienianie komunikatów systemowych lub komunikatów od deweloperów w nowych odpowiedziach.
No
max_output_tokens liczba całkowita Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widoczne tokeny wyjściowe i tokeny rozumowania.
No
parallel_tool_calls boolean Czy zezwolić modelowi na równoległe uruchamianie wywołań narzędzi.
No True
previous_response_id ciąg Unikatowy identyfikator poprzedniej odpowiedzi na model. Użyj tego, aby utworzyć wielokrotne konwersacje. No
reasoning Reasoning Opcje konfiguracji dla modeli rozumowania. No
przechowywać boolean Określa, czy przechowywać wygenerowaną odpowiedź modelu na potrzeby późniejszego pobierania za pośrednictwem interfejsu API.
No True
odtwarzać strumieniowo boolean W przypadku ustawienia wartości true dane odpowiedzi modelu będą przesyłane strumieniowo do klienta, ponieważ są generowane przy użyciu zdarzeń wysyłanych przez serwer. No False
SMS obiekt Opcje konfiguracji generowania odpowiedzi tekstowej przez model. Może to być zwykły tekst lub dane JSON ze strukturą. Więcej informacji:
- wprowadzanie tekstu i dane wyjściowe
- Ustrukturyzowane wyniki
No
Format └─ TextResponseFormatConfiguration Obiekt określający format, który musi zostać wygenerowany przez model.

Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, co zapewnia, że model jest zgodny ze podanym schematem JSON. Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.

Niezalecane w przypadku modeli gpt-4o i nowszych:

Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują.
No
tool_choice ToolChoiceOptions lub ToolChoiceTypes lub ToolChoiceFunction W jaki sposób model powinien wybrać narzędzie (lub narzędzia), które ma być używane podczas generowania odpowiedzi. Zobacz parametr , tools aby zobaczyć, jak określić narzędzia, które może wywołać model.
No
tools macierz Tablica narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając tool_choice parametr .

Dwie kategorie narzędzi, które można modelowi podać, to:

- Wbudowane narzędzia
No
truncation wyliczenie Strategia obcinania, która ma być użyta dla odpowiedzi modelu.
- auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstu modelu, model zostanie obcięty
odpowiedź mająca na celu dostosowanie się do okna kontekstu poprzez pominięcie elementów wejściowych w środku rozmowy.
- disabled (ustawienie domyślne): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstu dla modelu, żądanie zakończy się niepowodzeniem z powodu błędu 400.

Możliwe wartości: auto, disabled
No

DoubleClick

Dwukrotne kliknięcie myszy.

Name Typ Description Required Default
typ wyliczenie Określa typ zdarzenia. W przypadku akcji dwukrotnego kliknięcia ta właściwość jest zawsze ustawiana jako double_click.

Możliwe wartości: double_click
Yes
x liczba całkowita Współrzędna x, w której wystąpiło dwukrotne kliknięcie.
Yes
y liczba całkowita Współrzędna y, w której wystąpiło dwukrotne kliknięcie.
Yes

Drag

Czynność przeciągania.

Name Typ Description Required Default
ścieżka macierz Tablica współrzędnych reprezentujących ścieżkę operacji przeciągania. Współrzędne będą wyświetlane jako tablica obiektów, np.[{ x: 100, y: 200 }, { x: 200, y: 300 }] Yes
typ wyliczenie Określa typ zdarzenia. W przypadku akcji przeciągania ta właściwość jest zawsze ustawiana na drag.

Możliwe wartości: drag
Yes

EasyInputMessage

Wiadomość jako wejście do modelu z rolą wskazującą przestrzeganie hierarchii instrukcji. Instrukcje przypisane do roli developer lub system mają pierwszeństwo przed instrukcjami przypisanymi do roli user. Przyjmuje się, że komunikaty z rolą assistant zostały wygenerowane przez model w poprzednich interakcjach.

Name Typ Description Required Default
zawartość string lub InputMessageContentList Tekst, obraz lub dane wejściowe audio w modelu używane do generowania odpowiedzi.
Może również zawierać poprzednie odpowiedzi asystenta.
Yes
rola wyliczenie Rola wejścia komunikatu. userJeden z , assistant, systemlub developer.

Możliwe wartości: user, , assistant, systemdeveloper
Yes
typ wyliczenie Typ danych wejściowych komunikatu. Zawsze message.

Możliwe wartości: message
No

FileCitation

Cytat do pliku.

Name Typ Description Required Default
file_id ciąg Identyfikator pliku.
Yes
indeks liczba całkowita Indeks pliku na liście plików.
Yes
typ wyliczenie Typ cytowania pliku. Zawsze file_citation.

Możliwe wartości: file_citation
Yes

FilePath

Ścieżka do pliku.

Name Typ Description Required Default
file_id ciąg Identyfikator pliku.
Yes
indeks liczba całkowita Indeks pliku na liście plików.
Yes
typ wyliczenie Typ ścieżki pliku. Zawsze file_path.

Możliwe wartości: file_path
Yes

FileSearchRanker

Klasyfikator używany do wyszukiwania plików. Jeśli nie zostanie określony, system użyje klasyfikatora auto.

Property Value
Description Klasyfikator używany do wyszukiwania plików. Jeśli nie zostanie określony, system użyje klasyfikatora auto.
Type ciąg
Values auto
default_2024_08_21

FileSearchTool

Narzędzie wyszukujące odpowiednią zawartość z przekazanych plików.

Name Typ Description Required Default
filters Filtr porównawczy lub filtr złożony Filtr do zastosowania na podstawie atrybutów pliku. No
max_num_results liczba całkowita Maksymalna liczba wyników do zwrócenia. Ta liczba powinna należeć do zakresu od 1 do 50 włącznie.
No
ranking_options obiekt Opcje klasyfikacji wyszukiwania. No
└} ranker wyliczenie Klasyfikator używany do wyszukiwania plików.
Możliwe wartości: auto, default-2024-11-15
No
└─ próg_punktowy number Próg oceny dla wyszukiwania plików, liczba z zakresu od 0 do 1.
Liczby bliżej 1 będą próbować zwracać tylko najbardziej odpowiednie wyniki, ale mogą zwracać mniej wyników.
No 0
typ wyliczenie Typ narzędzia wyszukiwania plików. Zawsze file_search.

Możliwe wartości: file_search
Yes
vector_store_ids macierz Identyfikatory wektorów są przechowywane do wyszukiwania.
Yes

FileSearchToolCall

Wyniki wywołania narzędzia wyszukiwania plików.

Name Typ Description Required Default
id ciąg Unikatowy identyfikator wywołania narzędzia wyszukiwania plików.
Yes
queries macierz Zapytania używane do wyszukiwania plików.
Yes
results macierz Wyniki wywołania narzędzia wyszukiwania plików.
No
stan wyliczenie Stan wywołania narzędzia do wyszukiwania plików. in_progressJeden z , searchinglub incompletefailed,

Możliwe wartości: in_progress, , searchingcompleted, , incompletefailed
Yes
typ wyliczenie Typ wywołania narzędzia wyszukiwania plików. Zawsze file_search_call.

Możliwe wartości: file_search_call
Yes

FunctionTool

Definiuje funkcję w swoim kodzie, którą model może wywołać.

Name Typ Description Required Default
description ciąg Opis funkcji. Używany przez model do określania, czy wywołać funkcję.
No
name ciąg Nazwa funkcji do wywołania.
Yes
parameters obiekt Obiekt schematu JSON opisujący parametry funkcji.
Yes
strict boolean Czy wymusić ścisłą walidację parametrów. Wartość domyślna true.
Yes
typ wyliczenie Typ narzędzia funkcji. Zawsze function.

Możliwe wartości: function
Yes

FunctionToolCall

Wywołanie narzędzia w celu uruchomienia funkcji.

Name Typ Description Required Default
arguments ciąg Łańcuch JSON zawierający argumenty do przekazania do funkcji.
Yes
call_id ciąg Unikalny identyfikator wywołania funkcji narzędzia wygenerowany przez model.
Yes
id ciąg Unikatowy identyfikator wywołania narzędzia funkcjonalnego.
Yes
name ciąg Nazwa funkcji do uruchomienia.
Yes
stan wyliczenie Stan elementu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
No
typ wyliczenie Typ wywołania funkcji narzędziowej. Zawsze function_call.

Możliwe wartości: function_call
Yes

FunctionToolCallOutput

Dane wyjściowe wywołania narzędzia funkcji.

Name Typ Description Required Default
call_id ciąg Unikalny identyfikator wywołania funkcji narzędzia wygenerowany przez model.
Yes
id ciąg Unikatowy identyfikator danych wyjściowych wywołania narzędzia funkcji. Wypełniane, gdy ten element jest zwracany za pośrednictwem interfejsu API.
No
We/Wy ciąg Ciąg JSON zawierający dane wyjściowe z wywołania narzędzia funkcji.
Yes
stan wyliczenie Stan elementu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
No
typ wyliczenie Typ danych wyjściowych wywołania narzędzia funkcji. Zawsze function_call_output.

Możliwe wartości: function_call_output
Yes

FunctionToolCallOutputResource

Name Typ Description Required Default
call_id ciąg Unikalny identyfikator wywołania funkcji narzędzia wygenerowany przez model.
Yes
id ciąg Unikatowy identyfikator danych wyjściowych narzędzia wywołania funkcji.
Yes
We/Wy ciąg Ciąg JSON zawierający dane wyjściowe z wywołania narzędzia funkcji.
Yes
stan wyliczenie Stan elementu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
No
typ wyliczenie Typ danych wyjściowych wywołania narzędzia funkcji. Zawsze function_call_output.

Możliwe wartości: function_call_output
Yes

includable

Określ dodatkowe dane wyjściowe do uwzględnienia w odpowiedzi modelu. Obecnie obsługiwane wartości to:

  • file_search_call.results: uwzględnij wyniki operacji narzędzia do wyszukiwania plików.
  • message.input_image.image_url: dołącz adresy URL obrazów z komunikatu wejściowego.
  • computer_call_output.output.image_url: dołącz adresy URL obrazów z wyniku wywołania komputera.
Property Value
Description Określ dodatkowe dane wyjściowe do uwzględnienia w odpowiedzi modelu. Obecnie obsługiwane wartości to:
- file_search_call.results: Dołącz wyniki wyszukiwania uzyskane z wezwania narzędzia do wyszukiwania plików.
- message.input_image.image_url: dołącz adresy URL obrazów z komunikatu wejściowego.
- computer_call_output.output.image_url: dołącz adresy URL obrazów z wyników procesu komputerowego.
Type ciąg
Values file_search_call.results
message.input_image.image_url
computer_call_output.output.image_url

InputAudio

Dane audio jako wejście do modelu.

Name Typ Description Required Default
dane ciąg Dane audio zakodowane w formacie Base64.
Yes
format wyliczenie Format danych audio. Obecnie obsługiwane formaty to mp3 i wav.

Możliwe wartości: mp3, wav
Yes
typ wyliczenie Typ elementu wejściowego. Zawsze input_audio.

Możliwe wartości: input_audio
Yes

InputContent

Ten składnik może być jednym z następujących elementów:

InputFile

Plik wejściowy do modelu.

Name Typ Description Required Default
file_data ciąg Zawartość pliku, który ma zostać wysłany do modelu.
No
file_id ciąg Identyfikator pliku, który ma zostać wysłany do modelu.
No
filename ciąg Nazwa pliku, który ma zostać wysłany do modelu.
No
typ wyliczenie Typ elementu wejściowego. Zawsze input_file.

Możliwe wartości: input_file
Yes

InputImage

Dane wejściowe obrazu do modelu.

Name Typ Description Required Default
detail wyliczenie Poziom szczegółowości obrazu, który ma zostać wysłany do modelu. highJeden z , lowlub auto. Wartość domyślna to auto.

Możliwe wartości: high, , lowauto
Yes
file_id ciąg Identyfikator pliku, który ma zostać wysłany do modelu.
No
image_url ciąg Adres URL obrazu, który ma zostać wysłany do modelu. W pełni kwalifikowany adres URL lub obraz zakodowany w formacie base64 w adresie URL danych.
No
typ wyliczenie Typ elementu wejściowego. Zawsze input_image.

Możliwe wartości: input_image
Yes

InputItem

Ten składnik może być jednym z następujących elementów:

InputMessage

Wiadomość jako wejście do modelu z rolą wskazującą przestrzeganie hierarchii instrukcji. Instrukcje przypisane do roli developer lub system mają pierwszeństwo przed instrukcjami przypisanymi do roli user.

Name Typ Description Required Default
zawartość InputMessageContentList Lista jednego lub wielu elementów wejściowych do modelu zawierająca inną zawartość
types.
Yes
rola wyliczenie Rola wejścia komunikatu. userJeden z , systemlub developer.

Możliwe wartości: user, , systemdeveloper
Yes
stan wyliczenie Stan elementu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
No
typ wyliczenie Typ danych wejściowych komunikatu. Zawsze ustaw na message.

Możliwe wartości: message
No

InputMessageContentList

Lista jednego lub wielu elementów wejściowych do modelu zawierająca różne typy zawartości.

Brak zdefiniowanych właściwości dla tego składnika.

InputMessageResource

Name Typ Description Required Default
zawartość InputMessageContentList Lista jednego lub wielu elementów wejściowych do modelu zawierająca inną zawartość
types.
Yes
id ciąg Unikatowy identyfikator wejściowy wiadomości.
Yes
rola wyliczenie Rola wejścia komunikatu. userJeden z , systemlub developer.

Możliwe wartości: user, , systemdeveloper
Yes
stan wyliczenie Stan elementu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
No
typ wyliczenie Typ danych wejściowych komunikatu. Zawsze ustaw na message.

Możliwe wartości: message
No

InputText

Wprowadzanie tekstu do modelu.

Name Typ Description Required Default
SMS ciąg Wprowadzanie tekstu do modelu.
Yes
typ wyliczenie Typ elementu wejściowego. Zawsze input_text.

Możliwe wartości: input_text
Yes

Item

Element zawartości używany do generowania odpowiedzi.

Ten składnik może być jednym z następujących elementów:

ItemReference

Wewnętrzny identyfikator elementu do celów odniesienia.

Name Typ Description Required Default
id ciąg Identyfikator elementu referencyjnego.
Yes
typ wyliczenie Typ elementu referencyjnego. Zawsze item_reference.

Możliwe wartości: item_reference
Yes

ItemResource

Element zawartości używany do generowania odpowiedzi.

Ten składnik może być jednym z następujących elementów:

KeyPress

Kolekcja naciśnięć klawiszy, które model chciałby wykonać.

Name Typ Description Required Default
keys macierz Kombinacja klawiszy, którą model żąda naciśnięcia. Jest to tablica ciągów, z których każdy reprezentuje klucz.
Yes
typ wyliczenie Określa typ zdarzenia. W przypadku akcji keypress ta właściwość jest zawsze ustawiona na wartość keypress.

Możliwe wartości: keypress
Yes

Metadata

Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego.

Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków.

Brak zdefiniowanych właściwości dla tego składnika.

ModelResponseProperties

Name Typ Description Required Default
metadane Metadata Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego.

Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków.
No
model ciąg Model używany do generowania odpowiedzi. No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie.
No 1
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie.
No 1
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc usłudze OpenAI w monitorowaniu i wykrywaniu nadużyć. .
No

Move

Akcja ruchu myszy.

Name Typ Description Required Default
typ wyliczenie Określa typ zdarzenia. W przypadku akcji przenoszenia ta właściwość jest zawsze ustawiona na move.

Możliwe wartości: move
Yes
x liczba całkowita Współrzędna x, do której należy się przesunąć.
Yes
y liczba całkowita Współrzędna y, do której należy się przesunąć.
Yes

OutputAudio

Sygnał wyjściowy audio z modelu.

Name Typ Description Required Default
dane ciąg Dane audio zakodowane w formacie Base64 z modelu.
Yes
transkrypcja ciąg Transkrypcja danych audio z modelu.
Yes
typ wyliczenie Typ dźwięku wyjściowego. Zawsze output_audio.

Możliwe wartości: output_audio
Yes

OutputContent

Ten składnik może być jednym z następujących elementów:

OutputItem

Name Typ Description Required Default
akcja ComputerAction Yes
arguments ciąg Łańcuch JSON zawierający argumenty do przekazania do funkcji.
Yes
call_id ciąg Identyfikator używany podczas odpowiadania na wywołanie narzędzia z danymi wyjściowymi.
Yes
zawartość macierz Analiza zawartości tekstu.
Yes
id ciąg Unikatowy identyfikator zawartości rozumowania.
Yes
name ciąg Nazwa funkcji do uruchomienia.
Yes
pending_safety_checks macierz Oczekujące kontrole bezpieczeństwa dla wywołania komputera.
Yes
queries macierz Zapytania używane do wyszukiwania plików.
Yes
results macierz Wyniki wywołania narzędzia wyszukiwania plików.
No
rola wyliczenie Rola komunikatu wyjściowego. Zawsze assistant.

Możliwe wartości: assistant
Yes
stan wyliczenie Stan elementu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
Yes
typ wyliczenie Typ obiektu. Zawsze reasoning.

Możliwe wartości: reasoning
Yes

OutputMessage

Komunikat wyjściowy z modelu.

Name Typ Description Required Default
zawartość macierz Zawartość komunikatu wyjściowego.
Yes
id ciąg Unikatowy identyfikator komunikatu wyjściowego.
Yes
rola wyliczenie Rola komunikatu wyjściowego. Zawsze assistant.

Możliwe wartości: assistant
Yes
stan wyliczenie Stan danych wejściowych komunikatu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy wejściowe są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
Yes
typ wyliczenie Typ komunikatu wyjściowego. Zawsze message.

Możliwe wartości: message
Yes

OutputText

Dane wyjściowe tekstowe z modelu.

Name Typ Description Required Default
annotations macierz Adnotacje tekstu wyjściowego.
Yes
SMS ciąg Dane wyjściowe tekstu z modelu.
Yes
typ wyliczenie Typ tekstu wyjściowego. Zawsze output_text.

Możliwe wartości: output_text
Yes

RealtimeSessionCreateRequest

Konfiguracja obiektu sesji w czasie rzeczywistym.

Name Typ Description Required Default
input_audio_format wyliczenie Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.
W przypadku pcm16 dźwięk wejściowy musi być w formacie 16-bitowego PCM z częstotliwością próbkowania 24 kHz, z pojedynczym kanałem (mono) i w kolejności bajtów małobitowej.

Możliwe wartości: pcm16, , g711_ulawg711_alaw
No
input_audio_noise_reduction obiekt Konfiguracja redukcji szumu dźwięku wejściowego. Można to ustawić tak, null aby wyłączyć.
Filtry redukcji szumów przetwarzają dźwięk dodany do wejściowego bufora audio, zanim zostanie on wysłany do usługi VAD i modelu.
Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i zmian (zmniejszając liczbę fałszywie dodatnich wyników) oraz poprawić wydajność modelu poprzez polepszenie postrzegania dźwięku wejściowego.
No
└typ wyliczenie Typ redukcji szumu. near_field jest przeznaczony dla mikrofonów kierunkowych, takich jak te w słuchawkach, podczas gdy far_field jest przeznaczony dla mikrofonów dalekiego pola, takich jak te w laptopie lub w salach konferencyjnych.

Możliwe wartości: near_field, far_field
No
input_audio_transcription obiekt Konfiguracja transkrypcji dźwięku wejściowego, domyślnie wyłączona i może być ustawiona na null, aby wyłączyć po włączeniu. Transkrypcja audio wejściowego nie jest natywna dla modelu, ponieważ model korzysta bezpośrednio z dźwięku. Transkrypcja jest uruchamiana asynchronicznie za pośrednictwem punktu końcowego transkrypcji i powinna być traktowana jako wskazówki dotyczące wejściowej zawartości audio, a nie dokładnie tego, co usłyszał model. Klient ma możliwość ustawienia języka oraz wybrania opcji monitowania o transkrypcję, co zapewnia dodatkowe wskazówki dla usługi transkrypcyjnej.
No
└* język ciąg Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie.
No
Model └* ciąg Model używany do transkrypcji, bieżące opcje to gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15i whisper-1.
No
Zachęta └* ciąg Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio.
W przypadku whisper-1 polecenie to lista słów kluczowych.
W przypadku gpt-4o-transcribe modeli instrukcja jest wolnym ciągiem tekstowym, na przykład "oczekuj słów związanych z technologią".
No
instructions ciąg Domyślne instrukcje systemowe (tj. komunikat systemowy) są poprzedzane wywołaniami modelu. To pole umożliwia klientowi kierowanie odpowiedziami modelu w pożądany sposób. Model może być poinstruowany na temat zawartości i formatu odpowiedzi (np. "być bardzo zwięzły", "działać przyjazny", "oto przykłady dobrych odpowiedzi") i zachowania audio (np. "szybko rozmawiać", "wstrzykiwanie emocji do głosu", "śmiać się często"). Instrukcje nie gwarantują, że będą przestrzegane przez model, ale zapewniają przewodnictwo dotyczące pożądanego zachowania modelu.

Należy pamiętać, że serwer ustawia domyślne instrukcje, które będą używane, jeśli to pole nie jest ustawione i są widoczne w session.created zdarzeniu na początku sesji.
No
max_response_output_tokens liczba całkowita lub ciąg Maksymalna liczba tokenów wyjściowych dla pojedynczej odpowiedzi asystenta, w tym wywołań narzędzi. Podaj liczbę całkowitą z zakresu od 1 do 4096, aby ograniczyć liczbę tokenów wyjściowych, lub użyj inf dla maksymalnej liczby dostępnych tokenów dla danego modelu. Wartość domyślna to inf.
No
modalities Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"].
No
model ciąg Nazwa wdrożenia używanego na potrzeby tej sesji.
No
output_audio_format wyliczenie Format dźwięku wyjściowego. Opcje to pcm16, g711_ulawlub g711_alaw.
W przypadku pcm16parametru dźwięk wyjściowy jest próbkowany z szybkością 24kHz.

Możliwe wartości: pcm16, , g711_ulawg711_alaw
No
temperature number Temperatura próbkowania dla modelu ograniczona do [0.6, 1.2]. W przypadku modeli audio temperatura 0,8 jest zdecydowanie zalecana w celu uzyskania najlepszej wydajności.
No 0.8
tool_choice ciąg W jaki sposób model wybiera narzędzia. Opcje to auto, none, requiredlub określają funkcję.
No auto
tools macierz Narzędzia (funkcje) dostępne dla modelu. No
turn_detection obiekt Konfiguracja wykrywania zmian, albo Server VAD lub Semantic VAD. Można ustawić to na null aby wyłączyć, co spowoduje, że klient będzie musiał ręcznie wyzwolić odpowiedź modelu.
Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika.
Semantyczna funkcja VAD jest bardziej zaawansowana i używa modelu wykrywania zmiany mówcy (w połączeniu z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie określa limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika zacznie zanikać uhhm, model oceni niskie prawdopodobieństwo zakończenia wypowiedzi i poczeka dłużej na to, aby użytkownik kontynuował mowę. Może to być przydatne w przypadku bardziej naturalnych rozmów, ale może mieć większe opóźnienie.
No
└create_response boolean Określenie, czy odpowiedź powinna być automatycznie generowana po wystąpieniu zdarzenia zatrzymania VAD.
No True
└* gotowość wyliczenie Używane tylko w semantic_vad trybie. Gotowość modelu do reagowania. low będzie czekać dłużej, aż użytkownik będzie nadal mówić, high będzie reagować szybciej. auto jest wartością domyślną i jest odpowiednikiem medium.

Możliwe wartości: low, , medium, highauto
No
└reakcja_na_przerwanie boolean Określa, czy automatycznie przerywać bieżącą odpowiedź na rzecz wyjścia do domyślnej konwersacji (tj. conversation) po wystąpieniu zdarzenia rozpoczęcia VAD (tj. auto).
No True
└─prefix_padding_ms liczba całkowita Używane tylko w server_vad trybie. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms.
No
└czas_trwania_ciszy_ms liczba całkowita Używane tylko w server_vad trybie. Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika.
No
└* próg number Używane tylko w server_vad trybie. Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach.
No
└typ wyliczenie Typ wykrywania zakrętów.

Możliwe wartości: server_vad, semantic_vad
No
voice VoiceIdsShared No

RealtimeSessionCreateResponse

Nowa konfiguracja sesji w czasie rzeczywistym z kluczem efemerycznym. Domyślny czas wygaśnięcia kluczy to jedna minuta.

Name Typ Description Required Default
client_secret obiekt Klucz efemeryczny zwrócony przez API. Yes
└─ wygasa_o liczba całkowita Sygnatura czasowa dla czasu wygaśnięcia tokenu. Obecnie wszystkie tokeny wygasają po jednej minucie.
No
└─ wartość ciąg Klucz efemeryczny używany w środowiskach klienckich do uwierzytelniania połączeń z interfejsem API czasu rzeczywistego. Użyj tego w środowiskach po stronie klienta, zamiast standardowego tokena interfejsu API, którego należy używać tylko po stronie serwera.
No
input_audio_format ciąg Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.
No
input_audio_transcription obiekt Konfiguracja transkrypcji dźwięku wejściowego, domyślnie wyłączona i może być ustawiona na null, aby wyłączyć po włączeniu. Transkrypcja audio wejściowego nie jest natywna dla modelu, ponieważ model korzysta bezpośrednio z dźwięku. Transkrypcja jest uruchamiana asynchronicznie przez Whisper i powinna być traktowana jako orientacyjna wskazówka, a nie reprezentacja rozumiana przez model.
No
Model └* ciąg Model używany do transkrypcji whisper-1 jest jedynym obecnie obsługiwanym modelem.
No
instructions ciąg Domyślne instrukcje systemowe (tj. komunikat systemowy) są poprzedzane wywołaniami modelu. To pole umożliwia klientowi kierowanie odpowiedziami modelu w pożądany sposób. Model może być poinstruowany na temat zawartości i formatu odpowiedzi (np. "bądź bardzo zwięzły", "bądź przyjazny", "oto przykłady dobrych odpowiedzi") oraz dotyczące zachowania audio (np. "mów szybko", "wkładaj emocje w swój głos", "śmiej się często"). Instrukcje nie gwarantują, że będą przestrzegane przez model, ale zapewniają przewodnictwo dotyczące pożądanego zachowania modelu.
Należy pamiętać, że serwer ustawia domyślne instrukcje, które będą używane, jeśli to pole nie jest ustawione i są widoczne w session.created zdarzeniu na początku sesji.
No
max_response_output_tokens liczba całkowita lub ciąg Maksymalna liczba tokenów wyjściowych dla pojedynczej odpowiedzi asystenta, w tym wywołań narzędzi. Podaj liczbę całkowitą z zakresu od 1 do 4096, aby ograniczyć liczbę tokenów wyjściowych, lub użyj inf dla maksymalnej liczby dostępnych tokenów dla danego modelu. Wartość domyślna to inf.
No
modalities Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"].
No
output_audio_format ciąg Format dźwięku wyjściowego. Opcje to pcm16, g711_ulawlub g711_alaw.
No
temperature number Temperatura próbkowania dla modelu ograniczona do [0.6, 1.2]. Wartość domyślna to 0.8.
No
tool_choice ciąg W jaki sposób model wybiera narzędzia. Opcje to auto, none, requiredlub określają funkcję.
No
tools macierz Narzędzia (funkcje) dostępne dla modelu. No
turn_detection obiekt Konfiguracja wykrywania obrotu. null można ustawić, aby wyłączyć. Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika.
No
└─prefix_padding_ms liczba całkowita Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms.
No
└czas_trwania_ciszy_ms liczba całkowita Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika.
No
└* próg number Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach.
No
└typ ciąg Typ wykrywania skrętu, obecnie obsługiwany jest tylko server_vad.
No
voice VoiceIdsShared No

RealtimeTranscriptionSessionCreateRequest

Konfiguracja obiektu sesji transkrypcji w czasie rzeczywistym.

Name Typ Description Required Default
include macierz Zestaw elementów do uwzględnienia w transkrypcji. Bieżące dostępne elementy to:
- item.input_audio_transcription.logprobs
No
input_audio_format wyliczenie Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.
W przypadku pcm16 dźwięk wejściowy musi być w formacie 16-bitowego PCM z częstotliwością próbkowania 24 kHz, z pojedynczym kanałem (mono) i w kolejności bajtów małobitowej.

Możliwe wartości: pcm16, , g711_ulawg711_alaw
No
input_audio_noise_reduction obiekt Konfiguracja redukcji szumu dźwięku wejściowego. Można to ustawić tak, null aby wyłączyć.
Filtry redukcji szumów przetwarzają dźwięk dodany do wejściowego bufora audio, zanim zostanie on wysłany do usługi VAD i modelu.
Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i zmian (zmniejszając liczbę fałszywie dodatnich wyników) oraz poprawić wydajność modelu poprzez polepszenie postrzegania dźwięku wejściowego.
No
└typ wyliczenie Typ redukcji szumu. near_field jest przeznaczony dla mikrofonów kierunkowych, takich jak te w słuchawkach, podczas gdy far_field jest przeznaczony dla mikrofonów dalekiego pola, takich jak te w laptopie lub w salach konferencyjnych.

Możliwe wartości: near_field, far_field
No
input_audio_transcription obiekt Konfiguracja transkrypcji dźwięku wejściowego. Klient ma możliwość ustawienia języka oraz wybrania opcji monitowania o transkrypcję, co zapewnia dodatkowe wskazówki dla usługi transkrypcyjnej.
No
└* język ciąg Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie.
No
Model └* wyliczenie Model używany do transkrypcji, bieżące opcje to gpt-4o-transcribe, , gpt-4o-transcribe-diarizegpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15i whisper-1.

Możliwe wartości: gpt-4o-transcribe, , gpt-4o-transcribe-diarizegpt-4o-mini-transcribe, , gpt-4o-mini-transcribe-2025-12-15whisper-1
No
Zachęta └* ciąg Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio.
W przypadku whisper-1 polecenie to lista słów kluczowych.
W przypadku gpt-4o-transcribe modeli instrukcja jest wolnym ciągiem tekstowym, na przykład "oczekuj słów związanych z technologią".
No
modalities Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"].
No
turn_detection obiekt Konfiguracja wykrywania zmian, albo Server VAD lub Semantic VAD. Można ustawić to na null aby wyłączyć, co spowoduje, że klient będzie musiał ręcznie wyzwolić odpowiedź modelu.
Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika.
Semantyczna funkcja VAD jest bardziej zaawansowana i używa modelu wykrywania zmiany mówcy (w połączeniu z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie określa limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika zacznie zanikać uhhm, model oceni niskie prawdopodobieństwo zakończenia wypowiedzi i poczeka dłużej na to, aby użytkownik kontynuował mowę. Może to być przydatne w przypadku bardziej naturalnych rozmów, ale może mieć większe opóźnienie.
No
└create_response boolean Określenie, czy odpowiedź powinna być automatycznie generowana po wystąpieniu zdarzenia zatrzymania VAD. Niedostępne dla sesji transkrypcji.
No True
└* gotowość wyliczenie Używane tylko w semantic_vad trybie. Gotowość modelu do reagowania. low będzie czekać dłużej, aż użytkownik będzie nadal mówić, high będzie reagować szybciej. auto jest wartością domyślną i jest odpowiednikiem medium.

Możliwe wartości: low, , medium, highauto
No
└reakcja_na_przerwanie boolean Określa, czy automatycznie przerywać bieżącą odpowiedź na rzecz wyjścia do domyślnej konwersacji (tj. conversation) po wystąpieniu zdarzenia rozpoczęcia VAD (tj. auto). Niedostępne dla sesji transkrypcji.
No True
└─prefix_padding_ms liczba całkowita Używane tylko w server_vad trybie. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms.
No
└czas_trwania_ciszy_ms liczba całkowita Używane tylko w server_vad trybie. Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika.
No
└* próg number Używane tylko w server_vad trybie. Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach.
No
└typ wyliczenie Typ wykrywania zakrętów.

Możliwe wartości: server_vad, semantic_vad
No

RealtimeTranscriptionSessionCreateResponse

Nowa konfiguracja sesji transkrypcji w czasie rzeczywistym.

Po utworzeniu sesji na serwerze za pośrednictwem interfejsu API REST obiekt sesji zawiera również klucz efemeryczny. Domyślny czas wygaśnięcia kluczy to jedna minuta. Ta właściwość nie jest obecna, gdy sesja jest aktualizowana za pośrednictwem interfejsu API protokołu WebSocket.

Name Typ Description Required Default
client_secret obiekt Klucz efemeryczny zwrócony przez API. Występuje tylko wtedy, gdy sesja jest tworzona na serwerze za pośrednictwem interfejsu API REST.
Yes
└─ wygasa_o liczba całkowita Sygnatura czasowa dla czasu wygaśnięcia tokenu. Obecnie wszystkie tokeny wygasają po jednej minucie.
No
└─ wartość ciąg Klucz efemeryczny używany w środowiskach klienckich do uwierzytelniania połączeń z interfejsem API czasu rzeczywistego. Użyj tego w środowiskach po stronie klienta, zamiast standardowego tokena interfejsu API, którego należy używać tylko po stronie serwera.
No
input_audio_format ciąg Format wejściowego dźwięku. Opcje to pcm16, g711_ulawlub g711_alaw.
No
input_audio_transcription obiekt Konfiguracja modelu transkrypcji.
No
└* język ciąg Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np. en) zwiększa dokładność i opóźnienie.
No
Model └* wyliczenie Model używany do transkrypcji. Może to być gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15lub whisper-1.

Możliwe wartości: gpt-4o-transcribe, , gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15whisper-1
No
Zachęta └* ciąg Opcjonalny tekst wskazujący styl modelu lub jako kontynuacja poprzedniego segmentu audio. Komunikat powinien być zgodny z językiem dźwięku.
No
modalities Zestaw modalności, za pomocą których model może reagować. Aby wyłączyć dźwięk, ustaw wartość ["text"].
No
turn_detection obiekt Konfiguracja wykrywania obrotu. null można ustawić, aby wyłączyć. Funkcja VAD serwera oznacza, że model wykryje początek i koniec mowy na podstawie głośności audio i odpowie na końcu mowy użytkownika.
No
└─prefix_padding_ms liczba całkowita Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Wartość domyślna to 300 ms.
No
└czas_trwania_ciszy_ms liczba całkowita Czas trwania ciszy wykrywania zatrzymania mowy (w milisekundach). Wartość domyślna to 500 ms. Dzięki krótszym wartościom model będzie reagować szybciej, ale może wskoczyć na krótkie przerwy od użytkownika.
No
└* próg number Próg aktywacji dla usługi VAD (od 0.0 do 1.0) domyślnie wynosi 0,5. Wyższy próg będzie wymagać głośniejszego dźwięku do aktywowania modelu, a tym samym może działać lepiej w hałaśliwych środowiskach.
No
└typ ciąg Typ wykrywania skrętu, obecnie obsługiwany jest tylko server_vad.
No

Reasoning

Opcje konfiguracji dla modeli rozumowania.

Name Typ Description Required Default
nakład pracy ReasoningEffort Ogranicza nakład pracy na rozumowanie modeli rozumowania.
Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi.
Yes nośnik
podsumowanie wyliczenie Podsumowanie rozumowania wykonywanego przez model. Może to być przydatne do debugowania i zrozumienia procesu rozumowania modelu.
Jeden z concise lub detailed.

Możliwe wartości: concise, detailed
No

ReasoningItem

Opis łańcucha myśli używanego przez model rozumowania podczas generowania odpowiedzi.

Name Typ Description Required Default
zawartość macierz Analiza zawartości tekstu.
Yes
id ciąg Unikatowy identyfikator zawartości rozumowania.
Yes
stan wyliczenie Stan elementu. in_progressJeden z , completedlub incomplete. Wypełniane, gdy elementy są zwracane za pośrednictwem interfejsu API.

Możliwe wartości: in_progress, , completedincomplete
No
typ wyliczenie Typ obiektu. Zawsze reasoning.

Możliwe wartości: reasoning
Yes

Refusal

Odmowa ze strony modelu.

Name Typ Description Required Default
refusal ciąg Wyjaśnienie odmowy dostarczone przez model.
Yes
typ wyliczenie Rodzaj odmowy. Zawsze refusal.

Możliwe wartości: refusal
Yes

response

Name Typ Description Required Default
created_at number Sygnatura czasowa systemu Unix (w sekundach) czasu utworzenia tej odpowiedzi.
Yes
błąd ResponseError Obiekt błędu zwracany, gdy model nie może wygenerować odpowiedzi.
Yes
id ciąg Unikatowy identyfikator tej odpowiedzi.
Yes
incomplete_details obiekt Szczegółowe informacje o tym, dlaczego odpowiedź jest niekompletna.
Yes
└* przyczyna wyliczenie Powód, dla którego odpowiedź jest niekompletna.
Możliwe wartości: max_output_tokens, content_filter
No
instructions ciąg Wstawia komunikat systemu (lub dewelopera) jako pierwszy element w kontekście modelu.

Podczas używania previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia proste wymienianie komunikatów systemowych lub komunikatów od deweloperów w nowych odpowiedziach.
Yes
max_output_tokens liczba całkowita Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widoczne tokeny wyjściowe i stan konwersacji.
No
metadane Metadata Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego.

Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków.
Yes
model ciąg Model używany do generowania odpowiedzi. Yes
obiekt wyliczenie Typ obiektu tego zasobu — zawsze ustawiony na response.

Możliwe wartości: response
Yes
We/Wy macierz Tablica elementów zawartości wygenerowanych przez model.

— Długość i kolejność elementów w output tablicy zależy od odpowiedzi modelu.
— Zamiast uzyskiwać dostęp do pierwszego elementu w output tablicy i zakładając, że jest to komunikat z zawartością wygenerowaną assistant przez model, możesz rozważyć użycie output_text właściwości, która jest obsługiwana w zestawach SDK.
Yes
output_text ciąg Właściwość przeznaczona tylko dla zestawu SDK, która zawiera zagregowane dane wyjściowe tekstu ze wszystkich elementów w tablicy output_text, jeśli takowe istnieją.
Obsługiwane w zestawach SDK python i JavaScript.
No
parallel_tool_calls boolean Czy zezwolić modelowi na równoległe uruchamianie wywołań narzędzi.
Yes True
previous_response_id ciąg Unikatowy identyfikator poprzedniej odpowiedzi na model. Użyj tego, aby utworzyć wielokrotne konwersacje. No
reasoning Reasoning Opcje konfiguracji dla modeli rozumowania.
No
stan wyliczenie Stan generowania odpowiedzi. completedJeden z , failed, in_progresslub incomplete.

Możliwe wartości: completed, , failed, in_progressincomplete
No
temperature number Jaka temperatura próbkowania ma być używana z zakresu od 0 do 2. Wyższe wartości, takie jak 0,8, sprawią, że dane wyjściowe będą bardziej losowe, a niższe wartości, takie jak 0,2, sprawią, że będą bardziej skoncentrowane i deterministyczne.
Ogólnie zalecamy zmienić to lub top_p, ale nie obu jednocześnie.
Yes 1
SMS obiekt Opcje konfiguracji generowania odpowiedzi tekstowej przez model. Może to być zwykły tekst lub dane JSON ze strukturą. Więcej informacji:
- wprowadzanie tekstu i dane wyjściowe
- Ustrukturyzowane wyniki
No
Format └─ TextResponseFormatConfiguration Obiekt określający format, który musi zostać wygenerowany przez model.

Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, co zapewnia, że model jest zgodny ze podanym schematem JSON. Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.

Niezalecane w przypadku modeli gpt-4o i nowszych:

Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują.
No
tool_choice ToolChoiceOptions lub ToolChoiceTypes lub ToolChoiceFunction W jaki sposób model powinien wybrać narzędzie (lub narzędzia), które ma być używane podczas generowania odpowiedzi. Zobacz parametr , tools aby zobaczyć, jak określić narzędzia, które może wywołać model.
Yes
tools macierz Tablica narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając tool_choice parametr .

Dwie kategorie narzędzi, które można modelowi podać, to:

- Wbudowane narzędzia
Yes
top_p number Alternatywa dla próbkowania z temperaturą, zwana próbkowaniem jądra, gdzie model uwzględnia wyniki tokenów z masą prawdopodobieństwa top_p. Dlatego 0,1 oznacza, że uwzględniane są tylko tokeny znajdujące się w górnych 10% masy prawdopodobieństwa.

Ogólnie zalecamy zmienić to lub temperature, ale nie obu jednocześnie.
Yes 1
truncation wyliczenie Strategia obcinania, która ma być użyta dla odpowiedzi modelu.
- auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstu modelu, model obcina odpowiedź, aby dopasować okno kontekstu, upuszczając elementy wejściowe w środku konwersacji.
- disabled (ustawienie domyślne): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstu dla modelu, żądanie zakończy się niepowodzeniem z powodu błędu 400.

Możliwe wartości: auto, disabled
No
użycie ResponseUsage Reprezentuje szczegóły użycia tokenu, w tym tokeny wejściowe, tokeny wyjściowe, podział tokenów wyjściowych i łączną liczbę użytych tokenów.
No
użytkownik ciąg Unikatowy identyfikator reprezentujący użytkownika końcowego, który może pomóc usłudze OpenAI w monitorowaniu i wykrywaniu nadużyć. .
No

ResponseAudioDeltaEvent

Występuje w przypadku częściowej odpowiedzi głosowej.

Name Typ Description Required Default
delta ciąg Fragment bajtów audio odpowiedzi zakodowanych w formacie Base64.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.audio.delta.

Możliwe wartości: response.audio.delta
Yes

ResponseAudioDoneEvent

Emitowane po zakończeniu odpowiedzi audio.

Name Typ Description Required Default
typ wyliczenie Typ zdarzenia. Zawsze response.audio.done.

Możliwe wartości: response.audio.done
Yes

ResponseAudioTranscriptDeltaEvent

Emitowane w przypadku częściowej transkrypcji dźwięku.

Name Typ Description Required Default
delta ciąg Częściowa transkrypcja odpowiedzi audio.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.audio.transcript.delta.

Możliwe wartości: response.audio.transcript.delta
Yes

ResponseAudioTranscriptDoneEvent

Emitowany po zakończeniu pełnej transkrypcji audio.

Name Typ Description Required Default
typ wyliczenie Typ zdarzenia. Zawsze response.audio.transcript.done.

Możliwe wartości: response.audio.transcript.done
Yes

ResponseCodeInterpreterCallCodeDeltaEvent

Emitowane, gdy częściowy fragment kodu jest dodawany przez interpreter kodu.

Name Typ Description Required Default
delta ciąg Fragment kodu dodany przez interpreter kodu.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.code_interpreter_call.code.delta.

Możliwe wartości: response.code_interpreter_call.code.delta
Yes

ResponseCodeInterpreterCallCodeDoneEvent

Emitowane, gdy dane wyjściowe fragmentu kodu są finalizowane przez interpreter kodu.

Name Typ Description Required Default
kod ciąg Ostateczny wynik fragmentu kodu generowany przez interpretatora kodu.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.code_interpreter_call.code.done.

Możliwe wartości: response.code_interpreter_call.code.done
Yes

ResponseCodeInterpreterCallCompletedEvent

Emitowane po zakończeniu wywołania interpretera kodu.

Name Typ Description Required Default
code_interpreter_call CodeInterpreterToolCall Wywołanie narzędzia w celu uruchomienia kodu.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.code_interpreter_call.completed.

Możliwe wartości: response.code_interpreter_call.completed
Yes

ResponseCodeInterpreterCallInProgressEvent

Emitowane, gdy trwa wywołanie interpretera kodu.

Name Typ Description Required Default
code_interpreter_call CodeInterpreterToolCall Wywołanie narzędzia w celu uruchomienia kodu.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.code_interpreter_call.in_progress.

Możliwe wartości: response.code_interpreter_call.in_progress
Yes

ResponseCodeInterpreterCallInterpretingEvent

Emitowane, gdy interpreter kodu aktywnie interpretuje fragment kodu.

Name Typ Description Required Default
code_interpreter_call CodeInterpreterToolCall Wywołanie narzędzia w celu uruchomienia kodu.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, który jest w toku wywołania interpretera kodu.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.code_interpreter_call.interpreting.

Możliwe wartości: response.code_interpreter_call.interpreting
Yes

ResponseCompletedEvent

Emitowane po zakończeniu odpowiedzi modelu.

Name Typ Description Required Default
response response Yes
typ wyliczenie Typ zdarzenia. Zawsze response.completed.

Możliwe wartości: response.completed
Yes

ResponseContentPartAddedEvent

Emitowane po dodaniu nowej części zawartości.

Name Typ Description Required Default
content_index liczba całkowita Indeks dodanej części zawartości.
Yes
item_id ciąg Identyfikator elementu wyjściowego, do którego została dodana część zawartości.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, do którego została dodana część zawartości.
Yes
part OutputContent Yes
typ wyliczenie Typ zdarzenia. Zawsze response.content_part.added.

Możliwe wartości: response.content_part.added
Yes

ResponseContentPartDoneEvent

Emitowane po zakończeniu części zawartości.

Name Typ Description Required Default
content_index liczba całkowita Indeks części zawartości, która jest ukończona.
Yes
item_id ciąg Identyfikator elementu wyjściowego, do którego została dodana część zawartości.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, do którego została dodana część zawartości.
Yes
part OutputContent Yes
typ wyliczenie Typ zdarzenia. Zawsze response.content_part.done.

Możliwe wartości: response.content_part.done
Yes

ResponseCreatedEvent

Zdarzenie emitowane podczas tworzenia odpowiedzi.

Name Typ Description Required Default
response response Yes
typ wyliczenie Typ zdarzenia. Zawsze response.created.

Możliwe wartości: response.created
Yes

ResponseError

Obiekt błędu zwracany, gdy model nie może wygenerować odpowiedzi.

Name Typ Description Required Default
kod ResponseErrorCode Kod błędu odpowiedzi.
Yes
komunikat ciąg Czytelny dla człowieka opis błędu.
Yes

ResponseErrorCode

Kod błędu odpowiedzi.

Property Value
Description Kod błędu odpowiedzi.
Type ciąg
Values server_error
rate_limit_exceeded
invalid_prompt
vector_store_timeout
invalid_image
invalid_image_format
invalid_base64_image
invalid_image_url
image_too_large
image_too_small
image_parse_error
image_content_policy_violation
invalid_image_mode
image_file_too_large
unsupported_image_media_type
empty_image_file
failed_to_download_image
image_file_not_found

ResponseErrorEvent

Emitowane w przypadku wystąpienia błędu.

Name Typ Description Required Default
kod ciąg Kod błędu.
Yes
komunikat ciąg Komunikat o błędzie.
Yes
param ciąg Parametr błędu.
Yes
typ wyliczenie Typ zdarzenia. Zawsze error.

Możliwe wartości: error
Yes

ResponseFailedEvent

Zdarzenie emitowane w przypadku niepowodzenia odpowiedzi.

Name Typ Description Required Default
response response Yes
typ wyliczenie Typ zdarzenia. Zawsze response.failed.

Możliwe wartości: response.failed
Yes

ResponseFileSearchCallCompletedEvent

Emitowane po zakończeniu wywołania wyszukiwania plików (znaleziono wyniki).

Name Typ Description Required Default
item_id ciąg Identyfikator elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.file_search_call.completed.

Możliwe wartości: response.file_search_call.completed
Yes

ResponseFileSearchCallInProgressEvent

Emitowane po zainicjowaniu wywołania wyszukiwania plików.

Name Typ Description Required Default
item_id ciąg Identyfikator elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.file_search_call.in_progress.

Możliwe wartości: response.file_search_call.in_progress
Yes

ResponseFileSearchCallSearchingEvent

Emitowane, gdy wyszukiwanie plików jest obecnie przeszukiwane.

Name Typ Description Required Default
item_id ciąg Identyfikator elementu wyjściowego, dla którego zainicjowano wywołanie wyszukiwania plików.
Yes
output_index liczba całkowita Indeks elementu wyjściowego przeszukiwanego przez wywołanie wyszukiwania plików.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.file_search_call.searching.

Możliwe wartości: response.file_search_call.searching
Yes

ResponseFunctionCallArgumentsDeltaEvent

Emitowane, gdy występuje różnica w argumentach wywołania funkcji częściowej.

Name Typ Description Required Default
delta ciąg Dodano argument delta w wywołaniu funkcji.
Yes
item_id ciąg Identyfikator elementu wyjściowego, do którego dodano różnicę argumentów wywołania funkcji.
Yes
output_index liczba całkowita Indeks elementu wyjściowego do którego zostanie dodana różnica w argumentach wywołania funkcji.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.function_call_arguments.delta.

Możliwe wartości: response.function_call_arguments.delta
Yes

ResponseFunctionCallArgumentsDoneEvent

Emitowane, gdy argumenty wywołania funkcji są finalizowane.

Name Typ Description Required Default
arguments ciąg Argumenty wywołania funkcji. Yes
item_id ciąg Identyfikator elementu. Yes
output_index liczba całkowita Indeks elementu wyjściowego. Yes
typ wyliczenie
Możliwe wartości: response.function_call_arguments.done
Yes

ResponseInProgressEvent

Emitowane, gdy odpowiedź jest w toku.

Name Typ Description Required Default
response response Yes
typ wyliczenie Typ zdarzenia. Zawsze response.in_progress.

Możliwe wartości: response.in_progress
Yes

ResponseIncompleteEvent

Zdarzenie emitowane, gdy odpowiedź jest zakończona jako niekompletna.

Name Typ Description Required Default
response response Yes
typ wyliczenie Typ zdarzenia. Zawsze response.incomplete.

Możliwe wartości: response.incomplete
Yes

responseItemList

Lista elementów odpowiedzi.

Name Typ Description Required Default
dane macierz Lista elementów używanych do wygenerowania tej odpowiedzi. Yes
first_id ciąg Identyfikator pierwszego elementu na liście. Yes
has_more boolean Czy dostępnych jest więcej elementów? Yes
last_id ciąg Identyfikator ostatniego elementu na liście. Yes
obiekt wyliczenie Zwracany typ obiektu musi mieć wartość list.
Możliwe wartości: list
Yes

ResponseModalities

Typy danych wyjściowych, które mają być generowane przez model. Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną:

["text"]

Model gpt-4o-audio-preview może również służyć do generowania dźwięku. Aby zażądać, aby ten model wygenerował odpowiedzi tekstowe i audio, możesz użyć:

["text", "audio"]

Brak zdefiniowanych właściwości dla tego składnika.

ResponseModalitiesTextOnly

Typy danych wyjściowych, które mają być generowane przez model. Większość modeli jest w stanie wygenerować tekst, co jest wartością domyślną:

["text"]

Ten interfejs API wkrótce będzie obsługiwał inne modalności danych wyjściowych, w tym audio i obrazy.

Brak zdefiniowanych właściwości dla tego składnika.

ResponseOutputItemAddedEvent

Emitowane po dodaniu nowego elementu wyjściowego.

Name Typ Description Required Default
element OutputItem Yes
output_index liczba całkowita Indeks dodanego elementu wyjściowego.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.output_item.added.

Możliwe wartości: response.output_item.added
Yes

ResponseOutputItemDoneEvent

Emitowane, gdy element wyjściowy jest oznaczony jako zakończony.

Name Typ Description Required Default
element OutputItem Yes
output_index liczba całkowita Indeks elementu wyjściowego, który został oznaczony jako wykonany.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.output_item.done.

Możliwe wartości: response.output_item.done
Yes

ResponseProperties

Name Typ Description Required Default
instructions ciąg Wstawia komunikat systemu (lub dewelopera) jako pierwszy element w kontekście modelu.

Podczas używania previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia proste wymienianie komunikatów systemowych lub komunikatów od deweloperów w nowych odpowiedziach.
No
max_output_tokens liczba całkowita Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widoczne tokeny wyjściowe i stan konwersacji.
No
previous_response_id ciąg Unikatowy identyfikator poprzedniej odpowiedzi na model. Użyj tego, aby utworzyć wielokrotne konwersacje. No
reasoning Reasoning Opcje konfiguracji dla modeli rozumowania.
No
SMS obiekt Opcje konfiguracji generowania odpowiedzi tekstowej przez model. Może to być zwykły tekst lub dane JSON ze strukturą. Więcej informacji:
- wprowadzanie tekstu i dane wyjściowe
- Ustrukturyzowane wyniki
No
Format └─ TextResponseFormatConfiguration Obiekt określający format, który musi zostać wygenerowany przez model.

Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, co zapewnia, że model jest zgodny ze podanym schematem JSON. Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.

Niezalecane w przypadku modeli gpt-4o i nowszych:

Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują.
No
tool_choice ToolChoiceOptions lub ToolChoiceTypes lub ToolChoiceFunction W jaki sposób model powinien wybrać narzędzie (lub narzędzia), które ma być używane podczas generowania odpowiedzi. Zobacz parametr , tools aby zobaczyć, jak określić narzędzia, które może wywołać model.
No
tools macierz Tablica narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając tool_choice parametr .

Dwie kategorie narzędzi, które można modelowi podać, to:

- Wbudowane narzędzia
No
truncation wyliczenie Strategia obcinania, która ma być użyta dla odpowiedzi modelu.
- auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstu modelu, model obcina odpowiedź, aby dopasować okno kontekstu, upuszczając elementy wejściowe w środku konwersacji.
- disabled (ustawienie domyślne): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstu dla modelu, żądanie zakończy się niepowodzeniem z powodu błędu 400.

Możliwe wartości: auto, disabled
No

ResponseRefusalDeltaEvent

Emitowane w przypadku częściowego tekstu odmowy.

Name Typ Description Required Default
content_index liczba całkowita Indeks części zawartości, do którego jest dodawany tekst odmowy.
Yes
delta ciąg Tekst odmowy, który został dodany.
Yes
item_id ciąg Identyfikator elementu wyjściowego, do którego jest dodawany tekst odmowy.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, do którego jest dodawany tekst odmowy.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.refusal.delta.

Możliwe wartości: response.refusal.delta
Yes

ResponseRefusalDoneEvent

Emitowane, gdy tekst odmowy jest sfinalizowany.

Name Typ Description Required Default
content_index liczba całkowita Indeks części treści, w której tekst odmowy jest sfinalizowany.
Yes
item_id ciąg Identyfikator elementu wyjściowego, dla którego tekst odmowy jest finalizowany.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, w którym tekst odmowy został sfinalizowany.
Yes
refusal ciąg Tekst odmowy, który jest sfinalizowany.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.refusal.done.

Możliwe wartości: response.refusal.done
Yes

responseStreamEvent

Name Typ Description Required Default
adnotacja Annotation Yes
annotation_index liczba całkowita Indeks dodanej adnotacji.
Yes
arguments ciąg Argumenty wywołania funkcji. Yes
kod ciąg Kod błędu.
Yes
code_interpreter_call CodeInterpreterToolCall Wywołanie narzędzia w celu uruchomienia kodu.
Yes
content_index liczba całkowita Indeks części zawartości, w której treść tekstowa jest sfinalizowana.
Yes
delta ciąg Dodano zmianę tekstu.
Yes
element OutputItem Element wyjściowy, który został oznaczony jako wykonany.
Yes
item_id ciąg Identyfikator elementu wyjściowego, którego zawartość tekstowa jest finalizowana.
Yes
komunikat ciąg Komunikat o błędzie.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, którego treść tekstowa jest sfinalizowana.
Yes
param ciąg Parametr błędu.
Yes
part OutputContent Część zawartości, która jest wykonywana.
Yes
refusal ciąg Tekst odmowy, który jest sfinalizowany.
Yes
response response Odpowiedź, która była niekompletna.
Yes
SMS ciąg Zawartość tekstowa, która jest sfinalizowana.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.output_text.done.

Możliwe wartości: response.output_text.done
Yes

ResponseTextAnnotationDeltaEvent

Emitowane po dodaniu adnotacji tekstowej.

Name Typ Description Required Default
adnotacja Annotation Yes
annotation_index liczba całkowita Indeks dodanej adnotacji.
Yes
content_index liczba całkowita Indeks części zawartości, do którego dodano adnotację tekstową.
Yes
item_id ciąg Identyfikator elementu wyjściowego, do którego dodano adnotację tekstową.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, do którego dodano adnotację tekstową.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.output_text.annotation.added.

Możliwe wartości: response.output_text.annotation.added
Yes

ResponseTextDeltaEvent

Emitowane w przypadku dodatkowej zmiany tekstu.

Name Typ Description Required Default
content_index liczba całkowita Indeks części zawartości, do której dodano zmianę tekstową.
Yes
delta ciąg Dodano zmianę tekstu.
Yes
item_id ciąg Identyfikator elementu wyjściowego, do którego dodano różnicę tekstu.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, do którego dodano różnicę tekstu.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.output_text.delta.

Możliwe wartości: response.output_text.delta
Yes

ResponseTextDoneEvent

Emitowane po sfinalizowaniu zawartości tekstowej.

Name Typ Description Required Default
content_index liczba całkowita Indeks części zawartości, w której treść tekstowa jest sfinalizowana.
Yes
item_id ciąg Identyfikator elementu wyjściowego, którego zawartość tekstowa jest finalizowana.
Yes
output_index liczba całkowita Indeks elementu wyjściowego, którego treść tekstowa jest sfinalizowana.
Yes
SMS ciąg Zawartość tekstowa, która jest sfinalizowana.
Yes
typ wyliczenie Typ zdarzenia. Zawsze response.output_text.done.

Możliwe wartości: response.output_text.done
Yes

ResponseUsage

Reprezentuje szczegóły użycia tokenu, w tym tokeny wejściowe, tokeny wyjściowe, podział tokenów wyjściowych i łączną liczbę użytych tokenów.

Name Typ Description Required Default
input_tokens liczba całkowita Liczba tokenów wejściowych. Yes
output_tokens liczba całkowita Liczba tokenów wyjściowych. Yes
output_tokens_details obiekt Szczegółowy podział tokenów wyjściowych. Yes
└─ tokeny_rozumowania liczba całkowita Liczba tokenów rozumowania. No
total_tokens liczba całkowita Całkowita liczba użytych tokenów. Yes

Screenshot

Akcja zrzutu ekranu.

Name Typ Description Required Default
typ wyliczenie Określa typ zdarzenia. W przypadku akcji zrzutu ekranu ta właściwość jest zawsze ustawiona na screenshot.

Możliwe wartości: screenshot
Yes

Scroll

Akcja przewijania.

Name Typ Description Required Default
scroll_x liczba całkowita Odległość przewijania poziomego.
Yes
scroll_y liczba całkowita Odległość przewijania w pionie.
Yes
typ wyliczenie Określa typ zdarzenia. W przypadku akcji przewijania ta właściwość jest zawsze ustawiona na scroll.

Możliwe wartości: scroll
Yes
x liczba całkowita Współrzędna x, w której wystąpiło przewijanie.
Yes
y liczba całkowita Współrzędna y, w której wystąpiło przewijanie.
Yes

StopConfiguration

Maksymalnie 4 sekwencje, w których interfejs API przestaje generować kolejne tokeny. Zwrócony tekst nie będzie zawierać sekwencji zatrzymania.

Ten składnik może być jednym z następujących elementów:

TextResponseFormatConfiguration

Obiekt określający format, który musi zostać wygenerowany przez model.

Konfigurowanie { "type": "json_schema" } umożliwia korzystanie ze strukturowych danych wyjściowych, które zapewniają, że model jest zgodny z podanym schematem JSON.

Domyślny format to { "type": "text" } bez żadnych dodatkowych opcji.

Niezalecane w przypadku modeli gpt-4o i nowszych:

Włączenie trybu { "type": "json_object" } aktywuje starszy tryb JSON, co gwarantuje, że komunikat generowany przez model jest prawidłowym kodem JSON. Użycie json_schema jest preferowane w przypadku modeli, które go obsługują.

Ten składnik może być jednym z następujących elementów:

TextResponseFormatJsonSchema

Format odpowiedzi schematu JSON. Służy do generowania ustrukturyzowanych odpowiedzi JSON. Dowiedz się więcej o strukturach danych wyjściowych.

Name Typ Description Required Default
description ciąg Opis celu formatu odpowiedzi, który jest używany przez model do określenia, jak odpowiedzieć w tym formacie.
No
name ciąg Nazwa formatu odpowiedzi. Musi składać się z a-z, A-Z, 0-9 lub zawierać podkreślniki i kreski, z maksymalną długością 64 znaków.
No
schemat ResponseFormatJsonSchemaSchema Schemat formatu odpowiedzi, opisany jako obiekt schematu JSON. Yes
strict boolean Czy włączyć ścisłe przestrzeganie schematu podczas generowania danych wyjściowych.
W przypadku ustawienia wartości true model będzie zawsze przestrzegał dokładnego schematu zdefiniowanego schema w polu. Tylko podzbiór schematu JSON jest obsługiwany, gdy strict ma wartość true.
No False
typ wyliczenie Typ zdefiniowanego formatu odpowiedzi. Zawsze json_schema.
Możliwe wartości: json_schema
Yes

Tool

Ten składnik może być jednym z następujących elementów:

ToolChoiceFunction

Użyj tej opcji, aby wymusić wywołanie określonej funkcji przez model.

Name Typ Description Required Default
name ciąg Nazwa funkcji do wywołania. Yes
typ wyliczenie W przypadku wywoływania funkcji typ to zawsze function.
Możliwe wartości: function
Yes

ToolChoiceOptions

Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.

none oznacza, że model nie wywoła żadnego narzędzia i zamiast tego generuje komunikat.

auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia.

required oznacza, że model musi wywoływać co najmniej jedno narzędzie.

Property Value
Description Określa, które narzędzie (jeśli istnieje) jest wywoływane przez model.

none oznacza, że model nie wywoła żadnego narzędzia i zamiast tego generuje komunikat.

auto oznacza, że model może wybierać między generowaniem komunikatu lub wywoływaniem co najmniej jednego narzędzia.

required oznacza, że model musi wywoływać co najmniej jedno narzędzie.
Type ciąg
Values none
auto
required

ToolChoiceTypes

Wskazuje, że model powinien używać wbudowanego narzędzia do generowania odpowiedzi.

Name Typ Description Required Default
typ wyliczenie Typ hostowanego narzędzia, którego powinien używać model. Dozwolone wartości to:
- file_search
- computer_use_preview

Możliwe wartości: file_search, computer_use_preview
Yes

Typ

Akcja wpisywania tekstu.

Name Typ Description Required Default
SMS ciąg Tekst do wpisania.
Yes
typ wyliczenie Określa typ zdarzenia. Dla akcji typu, ten atrybut jest zawsze ustawiony na type.

Możliwe wartości: type
Yes

UpdateVectorStoreFileAttributesRequest

Name Typ Description Required Default
attributes VectorStoreFileAttributes Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości logiczne lub liczby.
Yes

UrlCitation

Cytat dotyczący zasobu internetowego używanego do generowania odpowiedzi modelu.

Name Typ Description Required Default
end_index liczba całkowita Indeks ostatniego znaku cytatu adresu URL w komunikacie.
Yes
start_index liczba całkowita Indeks pierwszego znaku cytatu adresu URL w komunikacie.
Yes
title ciąg Tytuł zasobu internetowego.
Yes
typ wyliczenie Typ cytatu adresu URL. Zawsze url_citation.

Możliwe wartości: url_citation
Yes
url ciąg Adres URL zasobu internetowego.
Yes

VectorStoreFileAttributes

Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości logiczne lub liczby.

Brak zdefiniowanych właściwości dla tego składnika.

VectorStoreFileContentResponse

Reprezentuje przeanalizowaną zawartość pliku magazynu wektorów.

Name Typ Description Required Default
dane macierz Przeanalizowana zawartość pliku. Yes
has_more boolean Wskazuje, czy do pobrania jest więcej stron zawartości. Yes
next_page ciąg Znacznik następnej strony, jeśli istnieje. Yes
obiekt wyliczenie Typ obiektu, który jest zawsze vector_store.file_content.page
Możliwe wartości: vector_store.file_content.page
Yes

VectorStoreSearchRequest

Name Typ Description Required Default
filters Filtr porównawczy lub filtr złożony Filtr do zastosowania na podstawie atrybutów pliku. No
max_num_results liczba całkowita Maksymalna liczba wyników do zwrócenia. Ta liczba powinna należeć do zakresu od 1 do 50 włącznie. No 10
kwerenda ciąg lub tablica Ciąg zapytania dla wyszukiwania Yes
ranking_options obiekt Opcje klasyfikacji wyszukiwania. No
└} ranker wyliczenie Możliwe wartości: auto, default-2024-11-15 No
└─ próg_punktowy number No 0
rewrite_query boolean Określa, czy należy ponownie napisać zapytanie języka naturalnego na potrzeby wyszukiwania wektorów. No False

VectorStoreSearchResultContentObject

Name Typ Description Required Default
SMS ciąg Zawartość tekstowa z wyników wyszukiwania. Yes
typ wyliczenie Typ zawartości.
Możliwe wartości: text
Yes

VectorStoreSearchResultItem

Name Typ Description Required Default
attributes VectorStoreFileAttributes Zestaw 16 par klucz-wartość, które można dołączyć do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w formacie ustrukturyzowanym i wykonywania zapytań dotyczących obiektów za pośrednictwem interfejsu API lub pulpitu nawigacyjnego. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości logiczne lub liczby.
Yes
zawartość macierz Fragmenty zawartości z pliku. Yes
file_id ciąg Identyfikator pliku magazynu wektorów. Yes
filename ciąg Nazwa pliku przechowującego wektory. Yes
wynik number Wynik oceny podobieństwa. Yes

VectorStoreSearchResultsPage

Name Typ Description Required Default
dane macierz Lista elementów wyników wyszukiwania. Yes
has_more boolean Wskazuje, czy istnieje więcej wyników do pobrania. Yes
next_page ciąg Znacznik następnej strony, jeśli istnieje. Yes
obiekt wyliczenie Typ obiektu, który jest zawsze vector_store.search_results.page
Możliwe wartości: vector_store.search_results.page
Yes
search_query macierz Yes

VoiceIdsShared

Brak zdefiniowanych właściwości dla tego składnika.

Wait

Akcja oczekiwania.

Name Typ Description Required Default
typ wyliczenie Określa typ zdarzenia. W przypadku akcji oczekiwania ta właściwość jest zawsze ustawiona na wait.

Możliwe wartości: wait
Yes

ReasoningEffort

Ogranicza nakład pracy na rozumowanie modeli rozumowania. Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi.

Property Value
Description Ogranicza nakład pracy na rozumowanie modeli rozumowania.
Obecnie obsługiwane wartości to low, mediumi high. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi.
Type ciąg
Default nośnik
Values low
medium
high

errorEvent

Występuje, gdy wystąpi błąd. Może się to zdarzyć z powodu wewnętrznego błędu serwera lub przekroczenia limitu czasu.

Name Typ Description Required Default
dane error Yes
wydarzenie ciąg Yes

event Enum: ErrorEventEnum

Value Description
błąd

doneEvent

Występuje po zakończeniu strumienia.

Name Typ Description Required Default
dane ciąg Yes
wydarzenie ciąg Yes

event Enum: DoneEventEnum

Value Description
done

data Enum: DoneEventDataEnum

Value Description
[DONE]

Dalsze kroki

Dowiedz się więcej o modelach i dostrajaniu za pomocą interfejsu API REST. Dowiedz się więcej o modelach bazowych, które zasilają usługę Azure OpenAI.