Freigeben über


Content Analyzers - Create Or Replace

Erstellen Sie asynchron einen neuen Analyzer.

PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}

URI-Parameter

Name In Erforderlich Typ Beschreibung
analyzerId
path True

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Die eindeutige Kennung des Analysators.

endpoint
path True

string (uri)

Inhaltsverständnis des Service-Endpunkts.

api-version
query True

string

minLength: 1

Hierbei handelt es sich um die für diesen Vorgang zu verwendende API-Version.

allowReplace
query

boolean

Erlauben Sie der Operation, eine bestehende Ressource zu ersetzen.

Anforderungsheader

Name Erforderlich Typ Beschreibung
x-ms-client-request-id

string (uuid)

Ein undurchsichtiger, global eindeutiger, clientgenerierter Zeichenfolgenbezeichner für die Anforderung.

Anforderungstext

Name Typ Beschreibung
baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Der Analysator, von dem man schrittweise trainieren kann.

config

ContentAnalyzerConfig

Konfigurationseinstellungen des Analyzers.

description

string

Eine Beschreibung des Analysators.

dynamicFieldSchema

boolean

Gibt an, ob das Ergebnis zusätzliche Felder außerhalb des definierten Schemas enthalten kann.

fieldSchema

ContentFieldSchema

Das Schema der zu extrahierenden Felder.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

Zusätzliche Wissensquellen werden verwendet, um den Analysator zu verbessern.

models

object

Abbildung von Modellrollen auf spezifische Modellnamen. Ex. { "completetion": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global.

tags

object

Tags, die mit dem Analyzer verbunden sind.

Antworten

Name Typ Beschreibung
200 OK

ContentAnalyzer

Die Anforderung ist erfolgreich.

Header

  • Operation-Location: string
  • x-ms-client-request-id: string
201 Created

ContentAnalyzer

Die Anforderung ist erfolgreich und eine neue Ressource wurde als Ergebnis erstellt.

Header

  • Operation-Location: string
  • x-ms-client-request-id: string
Other Status Codes

Azure.Core.Foundations.ErrorResponse

Unerwartete Fehlerantwort.

Header

x-ms-error-code: string

Sicherheit

Ocp-Apim-Subscription-Key

Schlüsselbasierte Authentifizierung mit dem Zugangsschlüssel der Azure-Ressource.

Typ: apiKey
In: header

EntraIdToken

Microsoft Entra ID OAuth2-Authentifizierung mit einem Zugangstoken.

Typ: oauth2
Ablauf: accessCode
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/authorize
Token-URL: https://login.microsoftonline.com/common/oauth2/token

Bereiche

Name Beschreibung
https://cognitiveservices.azure.com/.default

Beispiele

Create or Replace Analyzer

Beispielanforderung

PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01

{
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

Beispiel für eine Antwort

Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

Definitionen

Name Beschreibung
AnnotationFormat

Darstellungsformat der Annotationen im Analyseergebnis-Markdown.

Azure.Core.Foundations.Error

Das Fehlerobjekt.

Azure.Core.Foundations.ErrorResponse

Eine Antwort, die Fehlerdetails enthält.

Azure.Core.Foundations.InnerError

Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Richtlinien der Azure-REST-API: . https://aka.ms/AzureRestApiGuidelines#handling-errors

ChartFormat

Darstellungsformat von Diagrammen in Analyse der Ergebnismarkierung.

ContentAnalyzer

Analysator, der Inhalte und Felder aus multimodalen Dokumenten extrahiert.

ContentAnalyzerConfig

Konfigurationseinstellungen für einen Analyzer.

ContentAnalyzerStatus

Status einer Ressource.

ContentCategoryDefinition

Definition von Inhaltskategorien.

ContentFieldDefinition

Definition des Feldes mit einer JSON-Schema-ähnlichen Syntax.

ContentFieldSchema

Schema der Felder, die aus Dokumenten extrahiert werden sollen.

ContentFieldType

Semantischer Datentyp des Feldwerts.

GenerationMethod

Erzeugungsmethode.

KnowledgeSourceKind

Wissensquelle.

LabeledDataKnowledgeSource

Beschriftete Datenwissensquelle.

ProcessingLocation

Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global.

SupportedModels

Chat-Abschluss- und Einbettungsmodelle, die vom Analyzer unterstützt werden.

TableFormat

Darstellungsformat der Tabellen in Analyse von Ergebnismarkdown.

AnnotationFormat

Darstellungsformat der Annotationen im Analyseergebnis-Markdown.

Wert Beschreibung
none

Keine Anmerkungen darstellen.

markdown

Stellen Sie grundlegende Annotationsinformationen mit Markdown-Formatierung dar.

Azure.Core.Foundations.Error

Das Fehlerobjekt.

Name Typ Beschreibung
code

string

Eine serverdefinierte Gruppe von Fehlercodes.

details

Azure.Core.Foundations.Error[]

Ein Array von Details zu bestimmten Fehlern, die zu diesem gemeldeten Fehler geführt haben.

innererror

Azure.Core.Foundations.InnerError

Ein Objekt, das spezifischere Informationen enthält als das aktuelle Objekt über den Fehler.

message

string

Eine lesbare Darstellung des Fehlers.

target

string

Das Ziel des Fehlers.

Azure.Core.Foundations.ErrorResponse

Eine Antwort, die Fehlerdetails enthält.

Name Typ Beschreibung
error

Azure.Core.Foundations.Error

Das Fehlerobjekt.

Azure.Core.Foundations.InnerError

Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Richtlinien der Azure-REST-API: . https://aka.ms/AzureRestApiGuidelines#handling-errors

Name Typ Beschreibung
code

string

Eine serverdefinierte Gruppe von Fehlercodes.

innererror

Azure.Core.Foundations.InnerError

Innerer Fehler.

ChartFormat

Darstellungsformat von Diagrammen in Analyse der Ergebnismarkierung.

Wert Beschreibung
chartJs

Diagramme als Chart.js Codeblöcke darstellen.

markdown

Darstelle Diagramme als Markdown-Tabellen.

ContentAnalyzer

Analysator, der Inhalte und Felder aus multimodalen Dokumenten extrahiert.

Name Typ Standardwert Beschreibung
analyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Die eindeutige Kennung des Analysators.

baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

Der Analysator, von dem man schrittweise trainieren kann.

config

ContentAnalyzerConfig

Konfigurationseinstellungen des Analyzers.

createdAt

string (date-time)

Das Datum und die Uhrzeit, an der der Analyzer erstellt wurde.

description

string

Eine Beschreibung des Analysators.

dynamicFieldSchema

boolean

False

Gibt an, ob das Ergebnis zusätzliche Felder außerhalb des definierten Schemas enthalten kann.

fieldSchema

ContentFieldSchema

Das Schema der zu extrahierenden Felder.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

Zusätzliche Wissensquellen werden verwendet, um den Analysator zu verbessern.

lastModifiedAt

string (date-time)

Das Datum und die Uhrzeit, an der der Analyzer zuletzt modifiziert wurde.

models

object

Abbildung von Modellrollen auf spezifische Modellnamen. Ex. { "completetion": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

global

Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global.

status

ContentAnalyzerStatus

Der Status des Analysators.

supportedModels

SupportedModels

Chat-Abschluss- und Einbettungsmodelle, die vom Analyzer unterstützt werden.

tags

object

Tags, die mit dem Analyzer verbunden sind.

warnings

Azure.Core.Foundations.Error[]

Warnungen, die beim Erstellen des Analyzers aufgetreten sind.

ContentAnalyzerConfig

Konfigurationseinstellungen für einen Analyzer.

Name Typ Standardwert Beschreibung
annotationFormat

AnnotationFormat

markdown

Darstellungsformat der Annotationen im Analyseergebnis-Markdown.

chartFormat

ChartFormat

chartJs

Darstellungsformat von Diagrammen in Analyse der Ergebnismarkierung.

contentCategories

<string,  ContentCategoryDefinition>

Abbildung der Kategorien, um den Eingabeinhalt(en) zu klassifizieren.

disableFaceBlurring

boolean

Deaktivieren Sie das Standard-Unschärfen von Gesichtern aus Datenschutzgründen während der Verarbeitung des Inhalts.

enableFigureAnalysis

boolean

Ermöglichen Sie die Analyse von Figuren, wie Diagrammen und Diagrammen.

enableFigureDescription

boolean

Aktivieren Sie die Generierung der Figurenbeschreibung.

enableFormula

boolean

Mathematische Formelerkennung aktivieren.

enableLayout

boolean

Aktivieren Sie die Layout-Analyse.

enableOcr

boolean

Optische Zeichenerkennung (OCR) aktivieren.

enableSegment

boolean

Segmentierung der Eingabe nach contentCategories aktivieren.

estimateFieldSourceAndConfidence

boolean

Rücklandungsfeld Quelle und Vertrauen.

locales

string[]

Liste von Ortstipps für die Sprachtranskription.

omitContent

boolean

Lassen Sie den Inhalt dieses Analyzers aus dem Analyseergebnis weg. Geben Sie nur Inhalte von zusätzlichen Analysatoren zurück, die in contentCategories angegeben sind, falls vorhanden.

returnDetails

boolean

Geben Sie alle Inhaltsdetails zurück.

segmentPerPage

boolean

Erzwingen Sie die Segmentierung des Dokumentinhalts nach Seiten.

tableFormat

TableFormat

html

Darstellungsformat der Tabellen in Analyse von Ergebnismarkdown.

ContentAnalyzerStatus

Status einer Ressource.

Wert Beschreibung
creating

Die Ressource wird erstellt.

ready

Die Ressource ist bereit.

deleting

Die Ressource wird gelöscht.

failed

Die Ressource versagte während der Erstellung.

ContentCategoryDefinition

Definition von Inhaltskategorien.

Name Typ Beschreibung
analyzer

ContentAnalyzer

Optionale Inline-Definition des Analysators, der zur Verarbeitung des Inhalts verwendet wird.

analyzerId

string

Optionaler Analyzer, der zur Verarbeitung des Inhalts verwendet wird.

description

string

Die Beschreibung der Kategorie.

ContentFieldDefinition

Definition des Feldes mit einer JSON-Schema-ähnlichen Syntax.

Name Typ Beschreibung
$ref

string

Verweise auf eine andere Felddefinition.

description

string

Feldbeschreibung.

enum

string[]

Aufzählung möglicher Körperwerte.

enumDescriptions

object

Beschreibungen für jeden Aufzählungswert.

estimateSourceAndConfidence

boolean

Erdende Quelle und Vertrauen zurückgeben.

examples

string[]

Beispiele für Feldwerte.

items

ContentFieldDefinition

Feldtyp-Schema jedes Array-Elements, falls der Typ Array ist.

method

GenerationMethod

Erzeugungsmethode.

properties

<string,  ContentFieldDefinition>

Benannte Unterfelder, wenn der Typ Objekt ist.

type

ContentFieldType

Semantischer Datentyp des Feldwerts.

ContentFieldSchema

Schema der Felder, die aus Dokumenten extrahiert werden sollen.

Name Typ Beschreibung
definitions

<string,  ContentFieldDefinition>

Zusätzliche Definitionen, die durch die Felder im Schema referenziert werden.

description

string

Eine Beschreibung des Feldschemas.

fields

<string,  ContentFieldDefinition>

Die im Schema definierten Felder.

name

string

Der Name des Feldschemas.

ContentFieldType

Semantischer Datentyp des Feldwerts.

Wert Beschreibung
string

Nur-Text

date

Datum, normalisiert auf ISO 8601 (YYYY-MM-DD) Format.

time

Zeit, normalisiert auf ISO 8601 (hh:mm:ss) Format.

number

Nummern als doppelte Präzisions-Gleitkomma.

integer

Ganzzahl als 64-Bit-Zeichenzahl.

boolean

Boolescher Wert.

array

Liste der Teilbereiche desselben Typs.

object

Benannte Liste der Teilfelder.

json

JSON-Objekt.

GenerationMethod

Erzeugungsmethode.

Wert Beschreibung
generate

Werte werden frei basierend auf dem Inhalt generiert.

extract

Werte werden extrahiert, sobald sie im Inhalt erscheinen.

classify

Werte werden anhand einer vordefinierten Menge von Kategorien klassifiziert.

KnowledgeSourceKind

Wissensquelle.

Wert Beschreibung
labeledData

Eine beschriftete Daten-Wissensquelle.

LabeledDataKnowledgeSource

Beschriftete Datenwissensquelle.

Name Typ Beschreibung
containerUrl

string (uri)

Die URL des Blob-Containers mit beschrifteten Daten.

fileListPath

string

Ein optionaler Pfad zu einer Datei, der bestimmte Blobs auflistet, die aufgenommen werden sollen.

kind string:

labeledData

Die Art von Wissensquelle.

prefix

string

Ein optionales Präfix, um Blobs innerhalb des Containers zu filtern.

ProcessingLocation

Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global.

Wert Beschreibung
geography

Daten können in derselben Geografie wie die Ressource verarbeitet werden.

dataZone

Daten können in derselben Datenzone wie die Ressource verarbeitet werden.

global

Daten können in jedem Azure-Rechenzentrum weltweit verarbeitet werden.

SupportedModels

Chat-Abschluss- und Einbettungsmodelle, die vom Analyzer unterstützt werden.

Name Typ Beschreibung
completion

object

Chat-Abschlussmodelle, die vom Analyzer unterstützt werden.

embedding

object

Einbettung von Modellen, die vom Analysator unterstützt werden.

TableFormat

Darstellungsformat der Tabellen in Analyse von Ergebnismarkdown.

Wert Beschreibung
html

Repräsentieren Sie Tabellen mit HTML-Tabellenelementen: <Tabelle>, <th>, <tr>, <td>.

markdown

Repräsentiert Tabellen mit der GitHub Flavored Markdown-Tabellensyntax, die keine merged cells oder riched headers unterstützt.