Content Analyzers - Create Or Replace
Stwórz nowy analizator asynchronicznie.
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}
Parametry identyfikatora URI
| Nazwa | W | Wymagane | Typ | Opis |
|---|---|---|---|---|
|
analyzer
|
path | True |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Unikalny identyfikator analizatora. |
|
endpoint
|
path | True |
string (uri) |
Endpoint usługi Zrozumienie treści. |
|
api-version
|
query | True |
string minLength: 1 |
Wersja interfejsu API do użycia dla tej operacji. |
|
allow
|
query |
boolean |
Pozwól operacji zastąpić istniejący zasób. |
Nagłówek żądania
| Nazwa | Wymagane | Typ | Opis |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
Nieprzezroczystym, globalnie unikatowym identyfikatorem ciągu generowanego przez klienta dla żądania. |
Treść żądania
| Nazwa | Typ | Opis |
|---|---|---|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Analizator, z którego można stopniowo trenować. |
| config |
Ustawienia konfiguracji analizatora. |
|
| description |
string |
Opis analizatora. |
| dynamicFieldSchema |
boolean |
Wskazuje, czy wynik może zawierać dodatkowe pola poza zdefiniowanym schematem. |
| fieldSchema |
Schemat pól do wydobycia. |
|
| knowledgeSources | KnowledgeSource[]: |
Dodatkowe źródła wiedzy wykorzystane do ulepszania analizatora. |
| models |
object |
Mapowanie ról modeli na konkretne nazwy modeli. Np. { "completion": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
| processingLocation |
Miejsce, gdzie dane mogą być przetwarzane. Domyślnie jest globalny. |
|
| tags |
object |
Tagi powiązane z analizatorem. |
Odpowiedzi
| Nazwa | Typ | Opis |
|---|---|---|
| 200 OK |
Żądanie zakończyło się pomyślnie. Nagłówki
|
|
| 201 Created |
Żądanie zakończyło się pomyślnie i w rezultacie został utworzony nowy zasób. Nagłówki
|
|
| Other Status Codes |
Nieoczekiwana odpowiedź na błąd. Nagłówki x-ms-error-code: string |
Zabezpieczenia
Ocp-Apim-Subscription-Key
Uwierzytelnianie oparte na kluczu z wykorzystaniem klucza dostępu zasobu Azure.
Typ:
apiKey
W:
header
EntraIdToken
Uwierzytelnianie Microsoft Entra ID OAuth2 za pomocą tokena dostępu.
Typ:
oauth2
Flow:
accessCode
Adres URL autoryzacji:
https://login.microsoftonline.com/common/oauth2/authorize
Adres URL tokenu:
https://login.microsoftonline.com/common/oauth2/token
Zakresy
| Nazwa | Opis |
|---|---|
| https://cognitiveservices.azure.com/.default |
Przykłady
Create or Replace Analyzer
Przykładowe żądanie
PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01
{
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"baseAnalyzerId": "prebuilt-document",
"config": {
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Przykładowa odpowiedź
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Definicje
| Nazwa | Opis |
|---|---|
|
Annotation |
Format reprezentacji adnotacji w analizie wyników w znaczeniu wyników. |
|
Azure. |
Obiekt błędu. |
|
Azure. |
Odpowiedź zawierająca szczegółowe informacje o błędzie. |
|
Azure. |
Obiekt zawierający bardziej szczegółowe informacje o błędzie. Zgodnie z wytycznymi dotyczącymi interfejsu API REST platformy Azure — https://aka.ms/AzureRestApiGuidelines#handling-errors. |
|
Chart |
Format reprezentacji wykresów w analizie wyników w znaczeniu wyników. |
|
Content |
Analizator, który wyodrębnia zawartość i pola z dokumentów multimodalnych. |
|
Content |
Ustawienia konfiguracji analizatora. |
|
Content |
Status zasobu. |
|
Content |
Definicja kategorii treści. |
|
Content |
Definicja pola za pomocą składni podobnej do schematu JSON. |
|
Content |
Schemat pól do wyodrębnienia z dokumentów. |
|
Content |
Semantyczny typ danych wartości pola. |
|
Generation |
Metoda generowania. |
|
Knowledge |
Źródło wiedzy. |
|
Labeled |
Oznaczone źródło wiedzy o danych. |
|
Processing |
Miejsce, gdzie dane mogą być przetwarzane. Domyślnie jest globalny. |
|
Supported |
Modele uzupełniania czatu i osadzania obsługiwane przez analizator. |
|
Table |
Format reprezentacji tabel w analizie wyników w znaczeniu wyników. |
AnnotationFormat
Format reprezentacji adnotacji w analizie wyników w znaczeniu wyników.
| Wartość | Opis |
|---|---|
| none |
Nie reprezentuj adnotacji. |
| markdown |
Reprezentuj podstawowe informacje adnotacyjne za pomocą formatowania markdown. |
Azure.Core.Foundations.Error
Obiekt błędu.
| Nazwa | Typ | Opis |
|---|---|---|
| code |
string |
Jeden z zdefiniowanych przez serwer zestaw kodów błędów. |
| details |
Tablica szczegółów dotyczących określonych błędów, które doprowadziły do tego zgłoszonego błędu. |
|
| innererror |
Obiekt zawierający bardziej szczegółowe informacje niż bieżący obiekt o błędzie. |
|
| message |
string |
Czytelna dla człowieka reprezentacja błędu. |
| target |
string |
Element docelowy błędu. |
Azure.Core.Foundations.ErrorResponse
Odpowiedź zawierająca szczegółowe informacje o błędzie.
| Nazwa | Typ | Opis |
|---|---|---|
| error |
Obiekt błędu. |
Azure.Core.Foundations.InnerError
Obiekt zawierający bardziej szczegółowe informacje o błędzie. Zgodnie z wytycznymi dotyczącymi interfejsu API REST platformy Azure — https://aka.ms/AzureRestApiGuidelines#handling-errors.
| Nazwa | Typ | Opis |
|---|---|---|
| code |
string |
Jeden z zdefiniowanych przez serwer zestaw kodów błędów. |
| innererror |
Błąd wewnętrzny. |
ChartFormat
Format reprezentacji wykresów w analizie wyników w znaczeniu wyników.
| Wartość | Opis |
|---|---|
| chartJs |
Reprezentuj wykresy jako Chart.js bloki kodu. |
| markdown |
Reprezentuj wykresy jako tabele z obniżaniem cen. |
ContentAnalyzer
Analizator, który wyodrębnia zawartość i pola z dokumentów multimodalnych.
| Nazwa | Typ | Domyślna wartość | Opis |
|---|---|---|---|
| analyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Unikalny identyfikator analizatora. |
|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Analizator, z którego można stopniowo trenować. |
|
| config |
Ustawienia konfiguracji analizatora. |
||
| createdAt |
string (date-time) |
Data i godzina powstania analizatora. |
|
| description |
string |
Opis analizatora. |
|
| dynamicFieldSchema |
boolean |
False |
Wskazuje, czy wynik może zawierać dodatkowe pola poza zdefiniowanym schematem. |
| fieldSchema |
Schemat pól do wydobycia. |
||
| knowledgeSources | KnowledgeSource[]: |
Dodatkowe źródła wiedzy wykorzystane do ulepszania analizatora. |
|
| lastModifiedAt |
string (date-time) |
Data i godzina ostatniej modyfikacji analizatora. |
|
| models |
object |
Mapowanie ról modeli na konkretne nazwy modeli. Np. { "completion": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
|
| processingLocation | global |
Miejsce, gdzie dane mogą być przetwarzane. Domyślnie jest globalny. |
|
| status |
Status analizatora. |
||
| supportedModels |
Modele uzupełniania czatu i osadzania obsługiwane przez analizator. |
||
| tags |
object |
Tagi powiązane z analizatorem. |
|
| warnings |
Ostrzeżenia napotkane podczas tworzenia analizatora. |
ContentAnalyzerConfig
Ustawienia konfiguracji analizatora.
| Nazwa | Typ | Domyślna wartość | Opis |
|---|---|---|---|
| annotationFormat | markdown |
Format reprezentacji adnotacji w analizie wyników w znaczeniu wyników. |
|
| chartFormat | chartJs |
Format reprezentacji wykresów w analizie wyników w znaczeniu wyników. |
|
| contentCategories |
<string,
Content |
Mapowanie kategorii do klasyfikacji treści wejściowych względem nich. |
|
| disableFaceBlurring |
boolean |
Wyłącz domyślne rozmycie twarzy dla prywatności podczas przetwarzania treści. |
|
| enableFigureAnalysis |
boolean |
Umożliwić analizę rysunków, takich jak wykresy i diagramy. |
|
| enableFigureDescription |
boolean |
Włącz generowanie opisu figur. |
|
| enableFormula |
boolean |
Włącz wykrywanie wzorów matematycznych. |
|
| enableLayout |
boolean |
Włącz analizę układu. |
|
| enableOcr |
boolean |
Włącz optyczne rozpoznawanie znaków (OCR). |
|
| enableSegment |
boolean |
Włącz segmentację wejścia według contentCategories. |
|
| estimateFieldSourceAndConfidence |
boolean |
Źródło uziemienia i pewność siebie w polu zwrotnym. |
|
| locales |
string[] |
Lista podpowiedzi dotyczących lokalizacji transkrypcji mowy. |
|
| omitContent |
boolean |
Pomiń treść tego analizatora w wyniku analizy. Zwracaj tylko zawartość z dodatkowych analizatorów określonych w kategoriach contentCategories, jeśli takie istnieją. |
|
| returnDetails |
boolean |
Zwróć wszystkie szczegóły zawartości. |
|
| segmentPerPage |
boolean |
Wymuszamy segmentację zawartości dokumentu według stron. |
|
| tableFormat | html |
Format reprezentacji tabel w analizie wyników w znaczeniu wyników. |
ContentAnalyzerStatus
Status zasobu.
| Wartość | Opis |
|---|---|
| creating |
Zasób jest tworzony. |
| ready |
Zasób jest gotowy. |
| deleting |
Zasób jest usuwany. |
| failed |
Zasób zawiódł podczas tworzenia. |
ContentCategoryDefinition
Definicja kategorii treści.
| Nazwa | Typ | Opis |
|---|---|---|
| analyzer |
Opcjonalna definicja analizatora użytego do przetwarzania treści. |
|
| analyzerId |
string |
Opcjonalny analizator używany do przetwarzania treści. |
| description |
string |
Opis kategorii. |
ContentFieldDefinition
Definicja pola za pomocą składni podobnej do schematu JSON.
| Nazwa | Typ | Opis |
|---|---|---|
| $ref |
string |
Odniesienie do innej definicji dziedziny. |
| description |
string |
Opis pola. |
| enum |
string[] |
Wyliczanie możliwych wartości pól. |
| enumDescriptions |
object |
Opisy dla każdej wartości enumeracyjnej. |
| estimateSourceAndConfidence |
boolean |
Odzyskaj źródło uziemienia i pewność siebie. |
| examples |
string[] |
Przykłady wartości pól. |
| items |
Schemat typu pola dla każdego elementu tablicy, jeśli typ jest tablicą. |
|
| method |
Metoda generowania. |
|
| properties |
<string,
Content |
Nazwane podpola, jeśli typ jest obiektem. |
| type |
Semantyczny typ danych wartości pola. |
ContentFieldSchema
Schemat pól do wyodrębnienia z dokumentów.
| Nazwa | Typ | Opis |
|---|---|---|
| definitions |
<string,
Content |
Dodatkowe definicje odwoływane przez pola w schemie. |
| description |
string |
Opis schematu pola. |
| fields |
<string,
Content |
Pola zdefiniowane w schemacie. |
| name |
string |
Nazwa schematu pola. |
ContentFieldType
Semantyczny typ danych wartości pola.
| Wartość | Opis |
|---|---|
| string |
Zwykły tekst. |
| date |
Data, znormalizowana do formatu ISO 8601 (YYYY-MM-DD). |
| time |
Czas, znormalizowany do formatu ISO 8601 (hh:mm:ss). |
| number |
Liczba jako zmiennoprzecinkowa podwójna precyzja. |
| integer |
Liczba całkowita jako 64-bitowa liczba całkowita ze znakiem. |
| boolean |
Wartość logiczna. |
| array |
Lista podpól tego samego typu. |
| object |
Nazwana lista podpolów. |
| json |
Obiekt JSON. |
GenerationMethod
Metoda generowania.
| Wartość | Opis |
|---|---|
| generate |
Wartości są generowane swobodnie na podstawie treści. |
| extract |
Wartości są wyodrębniane tak, jak pojawiają się w treści. |
| classify |
Wartości są klasyfikowane względem z góry zdefiniowanego zbioru kategorii. |
KnowledgeSourceKind
Źródło wiedzy.
| Wartość | Opis |
|---|---|
| labeledData |
Oznaczone źródło wiedzy o danych. |
LabeledDataKnowledgeSource
Oznaczone źródło wiedzy o danych.
| Nazwa | Typ | Opis |
|---|---|---|
| containerUrl |
string (uri) |
URL kontenera blob zawierającego oznaczone dane. |
| fileListPath |
string |
Opcjonalna ścieżka do pliku zawierającego konkretne bloby do dodania. |
| kind |
string:
labeled |
To jest źródło wiedzy. |
| prefix |
string |
Opcjonalny prefiks filtrujący bloby wewnątrz kontenera. |
ProcessingLocation
Miejsce, gdzie dane mogą być przetwarzane. Domyślnie jest globalny.
| Wartość | Opis |
|---|---|
| geography |
Dane mogą być przetwarzane w tej samej geografii co zasob. |
| dataZone |
Dane mogą być przetwarzane w tej samej strefie danych co zasób. |
| global |
Dane mogą być przetwarzane w dowolnym centrum danych Azure na całym świecie. |
SupportedModels
Modele uzupełniania czatu i osadzania obsługiwane przez analizator.
| Nazwa | Typ | Opis |
|---|---|---|
| completion |
object |
Modele uzupełniania czatu wspierane przez analizator. |
| embedding |
object |
Modele osadzenia wspierane przez analizator. |
TableFormat
Format reprezentacji tabel w analizie wyników w znaczeniu wyników.
| Wartość | Opis |
|---|---|
| html |
Reprezentuj tabele za pomocą elementów tabeli HTML: <table, th>, <<tr>, <td>>. |
| markdown |
Reprezentuj tabele za pomocą składni tabel GitHub Flavored Markdown, która nie obsługuje połączonych komórek ani bogatych nagłówków. |