Content Analyzers - Create Or Replace
Erstellen Sie asynchron einen neuen Analyzer.
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}
URI-Parameter
| Name | In | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
|
analyzer
|
path | True |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Die eindeutige Kennung des Analysators. |
|
endpoint
|
path | True |
string (uri) |
Inhaltsverständnis des Service-Endpunkts. |
|
api-version
|
query | True |
string minLength: 1 |
Hierbei handelt es sich um die für diesen Vorgang zu verwendende API-Version. |
|
allow
|
query |
boolean |
Erlauben Sie der Operation, eine bestehende Ressource zu ersetzen. |
Anforderungsheader
| Name | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
Ein undurchsichtiger, global eindeutiger, clientgenerierter Zeichenfolgenbezeichner für die Anforderung. |
Anforderungstext
| Name | Typ | Beschreibung |
|---|---|---|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Der Analysator, von dem man schrittweise trainieren kann. |
| config |
Konfigurationseinstellungen des Analyzers. |
|
| description |
string |
Eine Beschreibung des Analysators. |
| dynamicFieldSchema |
boolean |
Gibt an, ob das Ergebnis zusätzliche Felder außerhalb des definierten Schemas enthalten kann. |
| fieldSchema |
Das Schema der zu extrahierenden Felder. |
|
| knowledgeSources | KnowledgeSource[]: |
Zusätzliche Wissensquellen werden verwendet, um den Analysator zu verbessern. |
| models |
object |
Abbildung von Modellrollen auf spezifische Modellnamen. Ex. { "completetion": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
| processingLocation |
Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global. |
|
| tags |
object |
Tags, die mit dem Analyzer verbunden sind. |
Antworten
| Name | Typ | Beschreibung |
|---|---|---|
| 200 OK |
Die Anforderung ist erfolgreich. Header
|
|
| 201 Created |
Die Anforderung ist erfolgreich und eine neue Ressource wurde als Ergebnis erstellt. Header
|
|
| Other Status Codes |
Unerwartete Fehlerantwort. Header x-ms-error-code: string |
Sicherheit
Ocp-Apim-Subscription-Key
Schlüsselbasierte Authentifizierung mit dem Zugangsschlüssel der Azure-Ressource.
Typ:
apiKey
In:
header
EntraIdToken
Microsoft Entra ID OAuth2-Authentifizierung mit einem Zugangstoken.
Typ:
oauth2
Ablauf:
accessCode
Autorisierungs-URL:
https://login.microsoftonline.com/common/oauth2/authorize
Token-URL:
https://login.microsoftonline.com/common/oauth2/token
Bereiche
| Name | Beschreibung |
|---|---|
| https://cognitiveservices.azure.com/.default |
Beispiele
Create or Replace Analyzer
Beispielanforderung
PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01
{
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"baseAnalyzerId": "prebuilt-document",
"config": {
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Beispiel für eine Antwort
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Definitionen
| Name | Beschreibung |
|---|---|
|
Annotation |
Darstellungsformat der Annotationen im Analyseergebnis-Markdown. |
|
Azure. |
Das Fehlerobjekt. |
|
Azure. |
Eine Antwort, die Fehlerdetails enthält. |
|
Azure. |
Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Richtlinien der Azure-REST-API: . https://aka.ms/AzureRestApiGuidelines#handling-errors |
|
Chart |
Darstellungsformat von Diagrammen in Analyse der Ergebnismarkierung. |
|
Content |
Analysator, der Inhalte und Felder aus multimodalen Dokumenten extrahiert. |
|
Content |
Konfigurationseinstellungen für einen Analyzer. |
|
Content |
Status einer Ressource. |
|
Content |
Definition von Inhaltskategorien. |
|
Content |
Definition des Feldes mit einer JSON-Schema-ähnlichen Syntax. |
|
Content |
Schema der Felder, die aus Dokumenten extrahiert werden sollen. |
|
Content |
Semantischer Datentyp des Feldwerts. |
|
Generation |
Erzeugungsmethode. |
|
Knowledge |
Wissensquelle. |
|
Labeled |
Beschriftete Datenwissensquelle. |
|
Processing |
Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global. |
|
Supported |
Chat-Abschluss- und Einbettungsmodelle, die vom Analyzer unterstützt werden. |
|
Table |
Darstellungsformat der Tabellen in Analyse von Ergebnismarkdown. |
AnnotationFormat
Darstellungsformat der Annotationen im Analyseergebnis-Markdown.
| Wert | Beschreibung |
|---|---|
| none |
Keine Anmerkungen darstellen. |
| markdown |
Stellen Sie grundlegende Annotationsinformationen mit Markdown-Formatierung dar. |
Azure.Core.Foundations.Error
Das Fehlerobjekt.
| Name | Typ | Beschreibung |
|---|---|---|
| code |
string |
Eine serverdefinierte Gruppe von Fehlercodes. |
| details |
Ein Array von Details zu bestimmten Fehlern, die zu diesem gemeldeten Fehler geführt haben. |
|
| innererror |
Ein Objekt, das spezifischere Informationen enthält als das aktuelle Objekt über den Fehler. |
|
| message |
string |
Eine lesbare Darstellung des Fehlers. |
| target |
string |
Das Ziel des Fehlers. |
Azure.Core.Foundations.ErrorResponse
Eine Antwort, die Fehlerdetails enthält.
| Name | Typ | Beschreibung |
|---|---|---|
| error |
Das Fehlerobjekt. |
Azure.Core.Foundations.InnerError
Ein Objekt, das spezifischere Informationen zum Fehler enthält. Gemäß den Richtlinien der Azure-REST-API: . https://aka.ms/AzureRestApiGuidelines#handling-errors
| Name | Typ | Beschreibung |
|---|---|---|
| code |
string |
Eine serverdefinierte Gruppe von Fehlercodes. |
| innererror |
Innerer Fehler. |
ChartFormat
Darstellungsformat von Diagrammen in Analyse der Ergebnismarkierung.
| Wert | Beschreibung |
|---|---|
| chartJs |
Diagramme als Chart.js Codeblöcke darstellen. |
| markdown |
Darstelle Diagramme als Markdown-Tabellen. |
ContentAnalyzer
Analysator, der Inhalte und Felder aus multimodalen Dokumenten extrahiert.
| Name | Typ | Standardwert | Beschreibung |
|---|---|---|---|
| analyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Die eindeutige Kennung des Analysators. |
|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
Der Analysator, von dem man schrittweise trainieren kann. |
|
| config |
Konfigurationseinstellungen des Analyzers. |
||
| createdAt |
string (date-time) |
Das Datum und die Uhrzeit, an der der Analyzer erstellt wurde. |
|
| description |
string |
Eine Beschreibung des Analysators. |
|
| dynamicFieldSchema |
boolean |
False |
Gibt an, ob das Ergebnis zusätzliche Felder außerhalb des definierten Schemas enthalten kann. |
| fieldSchema |
Das Schema der zu extrahierenden Felder. |
||
| knowledgeSources | KnowledgeSource[]: |
Zusätzliche Wissensquellen werden verwendet, um den Analysator zu verbessern. |
|
| lastModifiedAt |
string (date-time) |
Das Datum und die Uhrzeit, an der der Analyzer zuletzt modifiziert wurde. |
|
| models |
object |
Abbildung von Modellrollen auf spezifische Modellnamen. Ex. { "completetion": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
|
| processingLocation | global |
Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global. |
|
| status |
Der Status des Analysators. |
||
| supportedModels |
Chat-Abschluss- und Einbettungsmodelle, die vom Analyzer unterstützt werden. |
||
| tags |
object |
Tags, die mit dem Analyzer verbunden sind. |
|
| warnings |
Warnungen, die beim Erstellen des Analyzers aufgetreten sind. |
ContentAnalyzerConfig
Konfigurationseinstellungen für einen Analyzer.
| Name | Typ | Standardwert | Beschreibung |
|---|---|---|---|
| annotationFormat | markdown |
Darstellungsformat der Annotationen im Analyseergebnis-Markdown. |
|
| chartFormat | chartJs |
Darstellungsformat von Diagrammen in Analyse der Ergebnismarkierung. |
|
| contentCategories |
<string,
Content |
Abbildung der Kategorien, um den Eingabeinhalt(en) zu klassifizieren. |
|
| disableFaceBlurring |
boolean |
Deaktivieren Sie das Standard-Unschärfen von Gesichtern aus Datenschutzgründen während der Verarbeitung des Inhalts. |
|
| enableFigureAnalysis |
boolean |
Ermöglichen Sie die Analyse von Figuren, wie Diagrammen und Diagrammen. |
|
| enableFigureDescription |
boolean |
Aktivieren Sie die Generierung der Figurenbeschreibung. |
|
| enableFormula |
boolean |
Mathematische Formelerkennung aktivieren. |
|
| enableLayout |
boolean |
Aktivieren Sie die Layout-Analyse. |
|
| enableOcr |
boolean |
Optische Zeichenerkennung (OCR) aktivieren. |
|
| enableSegment |
boolean |
Segmentierung der Eingabe nach contentCategories aktivieren. |
|
| estimateFieldSourceAndConfidence |
boolean |
Rücklandungsfeld Quelle und Vertrauen. |
|
| locales |
string[] |
Liste von Ortstipps für die Sprachtranskription. |
|
| omitContent |
boolean |
Lassen Sie den Inhalt dieses Analyzers aus dem Analyseergebnis weg. Geben Sie nur Inhalte von zusätzlichen Analysatoren zurück, die in contentCategories angegeben sind, falls vorhanden. |
|
| returnDetails |
boolean |
Geben Sie alle Inhaltsdetails zurück. |
|
| segmentPerPage |
boolean |
Erzwingen Sie die Segmentierung des Dokumentinhalts nach Seiten. |
|
| tableFormat | html |
Darstellungsformat der Tabellen in Analyse von Ergebnismarkdown. |
ContentAnalyzerStatus
Status einer Ressource.
| Wert | Beschreibung |
|---|---|
| creating |
Die Ressource wird erstellt. |
| ready |
Die Ressource ist bereit. |
| deleting |
Die Ressource wird gelöscht. |
| failed |
Die Ressource versagte während der Erstellung. |
ContentCategoryDefinition
Definition von Inhaltskategorien.
| Name | Typ | Beschreibung |
|---|---|---|
| analyzer |
Optionale Inline-Definition des Analysators, der zur Verarbeitung des Inhalts verwendet wird. |
|
| analyzerId |
string |
Optionaler Analyzer, der zur Verarbeitung des Inhalts verwendet wird. |
| description |
string |
Die Beschreibung der Kategorie. |
ContentFieldDefinition
Definition des Feldes mit einer JSON-Schema-ähnlichen Syntax.
| Name | Typ | Beschreibung |
|---|---|---|
| $ref |
string |
Verweise auf eine andere Felddefinition. |
| description |
string |
Feldbeschreibung. |
| enum |
string[] |
Aufzählung möglicher Körperwerte. |
| enumDescriptions |
object |
Beschreibungen für jeden Aufzählungswert. |
| estimateSourceAndConfidence |
boolean |
Erdende Quelle und Vertrauen zurückgeben. |
| examples |
string[] |
Beispiele für Feldwerte. |
| items |
Feldtyp-Schema jedes Array-Elements, falls der Typ Array ist. |
|
| method |
Erzeugungsmethode. |
|
| properties |
<string,
Content |
Benannte Unterfelder, wenn der Typ Objekt ist. |
| type |
Semantischer Datentyp des Feldwerts. |
ContentFieldSchema
Schema der Felder, die aus Dokumenten extrahiert werden sollen.
| Name | Typ | Beschreibung |
|---|---|---|
| definitions |
<string,
Content |
Zusätzliche Definitionen, die durch die Felder im Schema referenziert werden. |
| description |
string |
Eine Beschreibung des Feldschemas. |
| fields |
<string,
Content |
Die im Schema definierten Felder. |
| name |
string |
Der Name des Feldschemas. |
ContentFieldType
Semantischer Datentyp des Feldwerts.
| Wert | Beschreibung |
|---|---|
| string |
Nur-Text |
| date |
Datum, normalisiert auf ISO 8601 (YYYY-MM-DD) Format. |
| time |
Zeit, normalisiert auf ISO 8601 (hh:mm:ss) Format. |
| number |
Nummern als doppelte Präzisions-Gleitkomma. |
| integer |
Ganzzahl als 64-Bit-Zeichenzahl. |
| boolean |
Boolescher Wert. |
| array |
Liste der Teilbereiche desselben Typs. |
| object |
Benannte Liste der Teilfelder. |
| json |
JSON-Objekt. |
GenerationMethod
Erzeugungsmethode.
| Wert | Beschreibung |
|---|---|
| generate |
Werte werden frei basierend auf dem Inhalt generiert. |
| extract |
Werte werden extrahiert, sobald sie im Inhalt erscheinen. |
| classify |
Werte werden anhand einer vordefinierten Menge von Kategorien klassifiziert. |
KnowledgeSourceKind
Wissensquelle.
| Wert | Beschreibung |
|---|---|
| labeledData |
Eine beschriftete Daten-Wissensquelle. |
LabeledDataKnowledgeSource
Beschriftete Datenwissensquelle.
| Name | Typ | Beschreibung |
|---|---|---|
| containerUrl |
string (uri) |
Die URL des Blob-Containers mit beschrifteten Daten. |
| fileListPath |
string |
Ein optionaler Pfad zu einer Datei, der bestimmte Blobs auflistet, die aufgenommen werden sollen. |
| kind |
string:
labeled |
Die Art von Wissensquelle. |
| prefix |
string |
Ein optionales Präfix, um Blobs innerhalb des Containers zu filtern. |
ProcessingLocation
Der Ort, an dem die Daten verarbeitet werden können. Standardmäßig steht es auf global.
| Wert | Beschreibung |
|---|---|
| geography |
Daten können in derselben Geografie wie die Ressource verarbeitet werden. |
| dataZone |
Daten können in derselben Datenzone wie die Ressource verarbeitet werden. |
| global |
Daten können in jedem Azure-Rechenzentrum weltweit verarbeitet werden. |
SupportedModels
Chat-Abschluss- und Einbettungsmodelle, die vom Analyzer unterstützt werden.
| Name | Typ | Beschreibung |
|---|---|---|
| completion |
object |
Chat-Abschlussmodelle, die vom Analyzer unterstützt werden. |
| embedding |
object |
Einbettung von Modellen, die vom Analysator unterstützt werden. |
TableFormat
Darstellungsformat der Tabellen in Analyse von Ergebnismarkdown.
| Wert | Beschreibung |
|---|---|
| html |
Repräsentieren Sie Tabellen mit HTML-Tabellenelementen: <Tabelle>, <th>, <tr>, <td>. |
| markdown |
Repräsentiert Tabellen mit der GitHub Flavored Markdown-Tabellensyntax, die keine merged cells oder riched headers unterstützt. |