Udostępnij przez


Content Analyzers - Create Or Replace

Stwórz nowy analizator asynchronicznie.

PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}

Parametry identyfikatora URI

Nazwa W Wymagane Typ Opis
analyzerId
path True

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Unikalny identyfikator analizatora.

endpoint
path True

string (uri)

Endpoint usługi Zrozumienie treści.

api-version
query True

string

minLength: 1

Wersja interfejsu API do użycia dla tej operacji.

allowReplace
query

boolean

Pozwól operacji zastąpić istniejący zasób.

Nagłówek żądania

Nazwa Wymagane Typ Opis
x-ms-client-request-id

string (uuid)

Nieprzezroczystym, globalnie unikatowym identyfikatorem ciągu generowanego przez klienta dla żądania.

Treść żądania

Nazwa Typ Opis
baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Analizator, z którego można stopniowo trenować.

config

ContentAnalyzerConfig

Ustawienia konfiguracji analizatora.

description

string

Opis analizatora.

dynamicFieldSchema

boolean

Wskazuje, czy wynik może zawierać dodatkowe pola poza zdefiniowanym schematem.

fieldSchema

ContentFieldSchema

Schemat pól do wydobycia.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

Dodatkowe źródła wiedzy wykorzystane do ulepszania analizatora.

models

object

Mapowanie ról modeli na konkretne nazwy modeli. Np. { "completion": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

Miejsce, gdzie dane mogą być przetwarzane. Domyślnie jest globalny.

tags

object

Tagi powiązane z analizatorem.

Odpowiedzi

Nazwa Typ Opis
200 OK

ContentAnalyzer

Żądanie zakończyło się pomyślnie.

Nagłówki

  • Operation-Location: string
  • x-ms-client-request-id: string
201 Created

ContentAnalyzer

Żądanie zakończyło się pomyślnie i w rezultacie został utworzony nowy zasób.

Nagłówki

  • Operation-Location: string
  • x-ms-client-request-id: string
Other Status Codes

Azure.Core.Foundations.ErrorResponse

Nieoczekiwana odpowiedź na błąd.

Nagłówki

x-ms-error-code: string

Zabezpieczenia

Ocp-Apim-Subscription-Key

Uwierzytelnianie oparte na kluczu z wykorzystaniem klucza dostępu zasobu Azure.

Typ: apiKey
W: header

EntraIdToken

Uwierzytelnianie Microsoft Entra ID OAuth2 za pomocą tokena dostępu.

Typ: oauth2
Flow: accessCode
Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/authorize
Adres URL tokenu: https://login.microsoftonline.com/common/oauth2/token

Zakresy

Nazwa Opis
https://cognitiveservices.azure.com/.default

Przykłady

Create or Replace Analyzer

Przykładowe żądanie

PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01

{
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

Przykładowa odpowiedź

Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

Definicje

Nazwa Opis
AnnotationFormat

Format reprezentacji adnotacji w analizie wyników w znaczeniu wyników.

Azure.Core.Foundations.Error

Obiekt błędu.

Azure.Core.Foundations.ErrorResponse

Odpowiedź zawierająca szczegółowe informacje o błędzie.

Azure.Core.Foundations.InnerError

Obiekt zawierający bardziej szczegółowe informacje o błędzie. Zgodnie z wytycznymi dotyczącymi interfejsu API REST platformy Azure — https://aka.ms/AzureRestApiGuidelines#handling-errors.

ChartFormat

Format reprezentacji wykresów w analizie wyników w znaczeniu wyników.

ContentAnalyzer

Analizator, który wyodrębnia zawartość i pola z dokumentów multimodalnych.

ContentAnalyzerConfig

Ustawienia konfiguracji analizatora.

ContentAnalyzerStatus

Status zasobu.

ContentCategoryDefinition

Definicja kategorii treści.

ContentFieldDefinition

Definicja pola za pomocą składni podobnej do schematu JSON.

ContentFieldSchema

Schemat pól do wyodrębnienia z dokumentów.

ContentFieldType

Semantyczny typ danych wartości pola.

GenerationMethod

Metoda generowania.

KnowledgeSourceKind

Źródło wiedzy.

LabeledDataKnowledgeSource

Oznaczone źródło wiedzy o danych.

ProcessingLocation

Miejsce, gdzie dane mogą być przetwarzane. Domyślnie jest globalny.

SupportedModels

Modele uzupełniania czatu i osadzania obsługiwane przez analizator.

TableFormat

Format reprezentacji tabel w analizie wyników w znaczeniu wyników.

AnnotationFormat

Format reprezentacji adnotacji w analizie wyników w znaczeniu wyników.

Wartość Opis
none

Nie reprezentuj adnotacji.

markdown

Reprezentuj podstawowe informacje adnotacyjne za pomocą formatowania markdown.

Azure.Core.Foundations.Error

Obiekt błędu.

Nazwa Typ Opis
code

string

Jeden z zdefiniowanych przez serwer zestaw kodów błędów.

details

Azure.Core.Foundations.Error[]

Tablica szczegółów dotyczących określonych błędów, które doprowadziły do tego zgłoszonego błędu.

innererror

Azure.Core.Foundations.InnerError

Obiekt zawierający bardziej szczegółowe informacje niż bieżący obiekt o błędzie.

message

string

Czytelna dla człowieka reprezentacja błędu.

target

string

Element docelowy błędu.

Azure.Core.Foundations.ErrorResponse

Odpowiedź zawierająca szczegółowe informacje o błędzie.

Nazwa Typ Opis
error

Azure.Core.Foundations.Error

Obiekt błędu.

Azure.Core.Foundations.InnerError

Obiekt zawierający bardziej szczegółowe informacje o błędzie. Zgodnie z wytycznymi dotyczącymi interfejsu API REST platformy Azure — https://aka.ms/AzureRestApiGuidelines#handling-errors.

Nazwa Typ Opis
code

string

Jeden z zdefiniowanych przez serwer zestaw kodów błędów.

innererror

Azure.Core.Foundations.InnerError

Błąd wewnętrzny.

ChartFormat

Format reprezentacji wykresów w analizie wyników w znaczeniu wyników.

Wartość Opis
chartJs

Reprezentuj wykresy jako Chart.js bloki kodu.

markdown

Reprezentuj wykresy jako tabele z obniżaniem cen.

ContentAnalyzer

Analizator, który wyodrębnia zawartość i pola z dokumentów multimodalnych.

Nazwa Typ Domyślna wartość Opis
analyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Unikalny identyfikator analizatora.

baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Analizator, z którego można stopniowo trenować.

config

ContentAnalyzerConfig

Ustawienia konfiguracji analizatora.

createdAt

string (date-time)

Data i godzina powstania analizatora.

description

string

Opis analizatora.

dynamicFieldSchema

boolean

False

Wskazuje, czy wynik może zawierać dodatkowe pola poza zdefiniowanym schematem.

fieldSchema

ContentFieldSchema

Schemat pól do wydobycia.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

Dodatkowe źródła wiedzy wykorzystane do ulepszania analizatora.

lastModifiedAt

string (date-time)

Data i godzina ostatniej modyfikacji analizatora.

models

object

Mapowanie ról modeli na konkretne nazwy modeli. Np. { "completion": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

global

Miejsce, gdzie dane mogą być przetwarzane. Domyślnie jest globalny.

status

ContentAnalyzerStatus

Status analizatora.

supportedModels

SupportedModels

Modele uzupełniania czatu i osadzania obsługiwane przez analizator.

tags

object

Tagi powiązane z analizatorem.

warnings

Azure.Core.Foundations.Error[]

Ostrzeżenia napotkane podczas tworzenia analizatora.

ContentAnalyzerConfig

Ustawienia konfiguracji analizatora.

Nazwa Typ Domyślna wartość Opis
annotationFormat

AnnotationFormat

markdown

Format reprezentacji adnotacji w analizie wyników w znaczeniu wyników.

chartFormat

ChartFormat

chartJs

Format reprezentacji wykresów w analizie wyników w znaczeniu wyników.

contentCategories

<string,  ContentCategoryDefinition>

Mapowanie kategorii do klasyfikacji treści wejściowych względem nich.

disableFaceBlurring

boolean

Wyłącz domyślne rozmycie twarzy dla prywatności podczas przetwarzania treści.

enableFigureAnalysis

boolean

Umożliwić analizę rysunków, takich jak wykresy i diagramy.

enableFigureDescription

boolean

Włącz generowanie opisu figur.

enableFormula

boolean

Włącz wykrywanie wzorów matematycznych.

enableLayout

boolean

Włącz analizę układu.

enableOcr

boolean

Włącz optyczne rozpoznawanie znaków (OCR).

enableSegment

boolean

Włącz segmentację wejścia według contentCategories.

estimateFieldSourceAndConfidence

boolean

Źródło uziemienia i pewność siebie w polu zwrotnym.

locales

string[]

Lista podpowiedzi dotyczących lokalizacji transkrypcji mowy.

omitContent

boolean

Pomiń treść tego analizatora w wyniku analizy. Zwracaj tylko zawartość z dodatkowych analizatorów określonych w kategoriach contentCategories, jeśli takie istnieją.

returnDetails

boolean

Zwróć wszystkie szczegóły zawartości.

segmentPerPage

boolean

Wymuszamy segmentację zawartości dokumentu według stron.

tableFormat

TableFormat

html

Format reprezentacji tabel w analizie wyników w znaczeniu wyników.

ContentAnalyzerStatus

Status zasobu.

Wartość Opis
creating

Zasób jest tworzony.

ready

Zasób jest gotowy.

deleting

Zasób jest usuwany.

failed

Zasób zawiódł podczas tworzenia.

ContentCategoryDefinition

Definicja kategorii treści.

Nazwa Typ Opis
analyzer

ContentAnalyzer

Opcjonalna definicja analizatora użytego do przetwarzania treści.

analyzerId

string

Opcjonalny analizator używany do przetwarzania treści.

description

string

Opis kategorii.

ContentFieldDefinition

Definicja pola za pomocą składni podobnej do schematu JSON.

Nazwa Typ Opis
$ref

string

Odniesienie do innej definicji dziedziny.

description

string

Opis pola.

enum

string[]

Wyliczanie możliwych wartości pól.

enumDescriptions

object

Opisy dla każdej wartości enumeracyjnej.

estimateSourceAndConfidence

boolean

Odzyskaj źródło uziemienia i pewność siebie.

examples

string[]

Przykłady wartości pól.

items

ContentFieldDefinition

Schemat typu pola dla każdego elementu tablicy, jeśli typ jest tablicą.

method

GenerationMethod

Metoda generowania.

properties

<string,  ContentFieldDefinition>

Nazwane podpola, jeśli typ jest obiektem.

type

ContentFieldType

Semantyczny typ danych wartości pola.

ContentFieldSchema

Schemat pól do wyodrębnienia z dokumentów.

Nazwa Typ Opis
definitions

<string,  ContentFieldDefinition>

Dodatkowe definicje odwoływane przez pola w schemie.

description

string

Opis schematu pola.

fields

<string,  ContentFieldDefinition>

Pola zdefiniowane w schemacie.

name

string

Nazwa schematu pola.

ContentFieldType

Semantyczny typ danych wartości pola.

Wartość Opis
string

Zwykły tekst.

date

Data, znormalizowana do formatu ISO 8601 (YYYY-MM-DD).

time

Czas, znormalizowany do formatu ISO 8601 (hh:mm:ss).

number

Liczba jako zmiennoprzecinkowa podwójna precyzja.

integer

Liczba całkowita jako 64-bitowa liczba całkowita ze znakiem.

boolean

Wartość logiczna.

array

Lista podpól tego samego typu.

object

Nazwana lista podpolów.

json

Obiekt JSON.

GenerationMethod

Metoda generowania.

Wartość Opis
generate

Wartości są generowane swobodnie na podstawie treści.

extract

Wartości są wyodrębniane tak, jak pojawiają się w treści.

classify

Wartości są klasyfikowane względem z góry zdefiniowanego zbioru kategorii.

KnowledgeSourceKind

Źródło wiedzy.

Wartość Opis
labeledData

Oznaczone źródło wiedzy o danych.

LabeledDataKnowledgeSource

Oznaczone źródło wiedzy o danych.

Nazwa Typ Opis
containerUrl

string (uri)

URL kontenera blob zawierającego oznaczone dane.

fileListPath

string

Opcjonalna ścieżka do pliku zawierającego konkretne bloby do dodania.

kind string:

labeledData

To jest źródło wiedzy.

prefix

string

Opcjonalny prefiks filtrujący bloby wewnątrz kontenera.

ProcessingLocation

Miejsce, gdzie dane mogą być przetwarzane. Domyślnie jest globalny.

Wartość Opis
geography

Dane mogą być przetwarzane w tej samej geografii co zasob.

dataZone

Dane mogą być przetwarzane w tej samej strefie danych co zasób.

global

Dane mogą być przetwarzane w dowolnym centrum danych Azure na całym świecie.

SupportedModels

Modele uzupełniania czatu i osadzania obsługiwane przez analizator.

Nazwa Typ Opis
completion

object

Modele uzupełniania czatu wspierane przez analizator.

embedding

object

Modele osadzenia wspierane przez analizator.

TableFormat

Format reprezentacji tabel w analizie wyników w znaczeniu wyników.

Wartość Opis
html

Reprezentuj tabele za pomocą elementów tabeli HTML: <table, th>, <<tr>, <td>>.

markdown

Reprezentuj tabele za pomocą składni tabel GitHub Flavored Markdown, która nie obsługuje połączonych komórek ani bogatych nagłówków.