Verständnis des Layout-API-Markdown-Ausgabeformats der Dokumentenintelligenz

Die Layout-API für Azure Document Intelligence in Foundry Tools kann Ihre Dokumente in rich Markdown umwandeln und dabei deren ursprüngliche Struktur und Formatierung beibehalten. Geben Sie outputContentFormat=markdown einfach in Ihrer Anforderung an, semantisch strukturierte Inhalte zu erhalten, die Absätze, Überschriften, Tabellen und andere Dokumentelemente in ihrer richtigen Hierarchie verwalten.

Mit dieser Markdown-Ausgabe wird die ursprüngliche Organisation des Dokuments elegant erfasst, während standardisierte, einfach konsumierbare Inhalte für downstream-Anwendungen bereitgestellt werden. Die beibehaltene semantische Struktur ermöglicht komplexere Dokumentverarbeitungsworkflows, ohne den Kontext und die Beziehungen zwischen Dokumentelementen zu verlieren.

In der Layoutanalyse unterstützte Markdown-Elemente

Die folgenden Markdown-Elemente sind in Layout-API-Antworten enthalten:

Paragraph
Überschrift
Tabelle
Abbildung
Auswahlmarkierung
Formel
Barcode
Seitennummer/Seitenkopf/Seitenfuß
PageBreak
Schlüssel-Wert-Paare/Sprache/Stil
Spans und Inhalt

Paragraph

Absätze stellen zusammenhängende Textblöcke dar, die semantisch zusammengehören. Die Layout-API sorgt für die Integrität von Absätzen, indem:

Beibehalten von Absatzgrenzen mit leeren Zeilen zwischen getrennten Absätzen
Verwenden von Zeilenumbrüchen innerhalb von Absätzen zur Beibehaltung der visuellen Struktur des ursprünglichen Dokuments
Beibehalten eines ordnungsgemäßen Textflusses, der die Lesereihenfolge des Originaldokuments berücksichtigt

Ein Beispiel:

This is paragraph 1.
This is still paragraph 1, even if in another Markdown line.

This is paragraph 2. There is a blank line between paragraph 1 and paragraph 2.

Überschrift

Überschriften organisieren Dokumentinhalte in einer hierarchischen Struktur, um die Navigation und das Verständnis zu vereinfachen. Die Layout-API verfügt über die folgenden Funktionen:

Verwendet die standardmäßige Markdown-Überschriftensyntax mit 1-6 Hashsymbolen (#), die überschriftenebenen entsprechen.
Behält den richtigen Abstand mit zwei leeren Zeilen vor jeder Überschrift bei, um die Lesbarkeit zu verbessern.

Ein Beispiel:

# This is a title

## This is heading 1

### This is heading 2

#### This is heading 3

Tabelle

Tabellen bewahren komplexe strukturierte Daten in einem visuell organisierten Format auf. Die Layout-API verwendet html-Tabellensyntax für maximale Genauigkeit und Kompatibilität:

Implementiert vollständiges HTML-Tabellenmarkup (<table>, <tr>, <th>, <td>) anstelle standardmäßiger Markdown-Tabellen
Behält verbundene Zelle mit HTML-Rowspan- und Colspan-Attributen bei.
Behält Tabellenbeschriftungen mit dem <caption> Tag bei, um den Dokumentkontext aufrechtzuerhalten.
Behandelt komplexe Tabellenstrukturen, einschließlich Kopfzeilen, Zellen und Fußzeilen
Behält den richtigen Abstand mit zwei leeren Zeilen vor jeder Tabelle bei, um die Lesbarkeit zu verbessern.
Behält Tabellennoten als separaten Absatz nach der Tabelle bei

Ein Beispiel:

<table>
<caption>Table 1. This is a demo table</caption>
<tr><th>Header</th><th>Header</th></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Footer</td><td>Footer</td></tr>
</table>
This is the footnote of the table.

Abbildung

Die Layout-API behält Abbildungselemente bei:

Kapselt Abbildungsinhalte in <figure> Tags, um die semantische Unterscheidung vom umgebenden Text beizubehalten
Behält Abbildungsbeschriftungen mit dem Tag <figcaption> bei, um wichtigen Kontext bereitzustellen
Behält Fußnoten von Abbildungen als separate Absätze nach dem Abbildungscontainer bei

Von Bedeutung

In Fällen, in denen bestimmte Dokumentkomponenten wie die Abschnittsüberschrift als Teil der Abbildungen erkannt werden, stellt die Markdownausgabe keine Zahlen in der Ausgabe dar und verwendet die Informationen für die Dokumentstrukturanalyse. Zählen Sie in diesen Fällen das Zahlenfeld in JSON auf, um alle Zahlen abzurufen.

Ein Beispiel:

<figure>
<figcaption>Figure 2 This is a figure</figcaption>

Values
300
200
100
0

Jan Feb Mar Apr May Jun Months

</figure>

This is footnote if the figure have.

Auswahlmarkierung

Auswahlzeichen stellen Kontrollkästchen-ähnliche Elemente in Formularen und Dokumenten dar. Die Layout-API:

Verwendet Unicode-Zeichen zur visuellen Klarheit: ☒ (aktiviert) und ☐ (deaktiviert)
Filtert Kontrollkästchenerkennungen mit niedriger Vertrauenswürdigkeit (unter 0,1 Konfidenz) aus, um die Zuverlässigkeit zu verbessern.
Verwaltet die semantische Beziehung zwischen Auswahlzeichen und dem zugehörigen Text.

Formel

Mathematische Formeln bleiben mit laTeX-kompatibler Syntax erhalten, die das Rendern komplexer mathematischer Ausdrücke ermöglicht:

Inlineformeln werden in einzelne Dollarzeichen ( $...$ ) eingeschlossen, um den Textfluss aufrechtzuerhalten.
Blockformeln verwenden doppelte Dollarzeichen ($$...$$) für die eigenständige Anzeige
Mehrzeilige Formeln werden als aufeinander folgende Blockformeln dargestellt, wobei mathematische Beziehungen erhalten bleiben
Der ursprüngliche Abstand und die Formatierung werden beibehalten, um eine genaue Darstellung sicherzustellen.

Hier sehen Sie ein Beispiel für Inlineformel, einzeiligen Formelblock und mehrzeiligen Formelblock:

The mass-energy equivalence formula $E = m c ^ { 2 }$ is an example of an inline formula

$$\frac { n ! } { k ! \left( n - k \right) ! } = \binom { n } { k }$$

$$\frac { p _ { j } } { p _ { 1 } } = \prod _ { k = 1 } ^ { j - 1 } e ^ { - \beta _ { k , k + 1 } \Delta E _ { k , k + 1 } }$$
$$= \exp \left[ - \sum _ { k = 1 } ^ { j - 1 } \beta _ { k , k + 1 } \Delta E _ { k , k + 1 } \right] .$$

Barcode

Barcodes und QR-Codes werden mithilfe der Markdown-Bildsyntax mit hinzugefügten semantischen Informationen dargestellt:

Verwendet die standardmäßige Bildmarkdownsyntax mit beschreibenden Attributen
Erfasst sowohl den Barcodetyp (QR-Code, Barcode usw.) als auch den codierten Wert.
Behält die semantische Beziehung zwischen Barcodes und umgebendem Inhalt bei

Ein Beispiel:

![QRCode](barcodes/1.1 "https://www.microsoft.com")

![UPCA](barcodes/1.2 "012345678905")
 
![barcode type](barcodes/pagenumber.barcodenumber "barcode value/content")

Seitennummer/Seitenkopf/Seitenfuß

Seitenmetadatenelemente bieten Kontext zur Dokument paginierung, sollten aber nicht inline mit dem Hauptinhalt angezeigt werden:

Eingeschlossen in HTML-Kommentare, um die Informationen beizubehalten, während sie vom standardmäßigen Markdown-Rendering ausgeblendet bleiben
Behält ursprüngliche Seitenstrukturinformationen bei, die für die Dokumentrekonstruktion hilfreich sein können
Ermöglicht Es Anwendungen, die Dokument paginierung zu verstehen, ohne den Inhaltsfluss zu unterbrechen

Ein Beispiel:

<!-- PageHeader="This is page header" -->

<!-- PageFooter="This is page footer" -->
<!-- PageNumber="1" -->

PageBreak

Um leicht herauszufinden, welche Teile zu welcher Seitenbasis auf dem reinen Markdown-Inhalt gehören, haben wir PageBreak als Trennzeichen der Seiten eingeführt.

Ein Beispiel:

<!-- PageBreak -->

Schlüssel-Wert-Paare/Sprache/Stil

Wir ordnen KeyValuePairs/Language/Style dem JSON-Inhalt der Analyse zu und nicht dem Inhalt in Markdown.

Hinweis

Weitere Informationen zu Markdown, die derzeit für Benutzerinhalte auf GitHub.com unterstützt wird, finden Sie unterGitHub Flavored Markdown Spec.

Schlussfolgerung

Die Markdown-Elemente von Document Intelligence bieten eine leistungsstarke Möglichkeit, die Struktur und den Inhalt analysierter Dokumente darzustellen. Indem Sie diese Markdown-Elemente verstehen und ordnungsgemäß verwenden, können Sie Ihre Dokumentverarbeitungsworkflows verbessern und komplexere Inhaltsextraktionsanwendungen erstellen.

Nächste Schritte

Versuchen Sie, Ihre Dokumente mit Document Intelligence Studio zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.

Feedback

War diese Seite hilfreich?

Last updated on 2025-11-18

Freigeben über

Verständnis des Layout-API-Markdown-Ausgabeformats der Dokumentenintelligenz

In der Layoutanalyse unterstützte Markdown-Elemente

Paragraph

Überschrift

Tabelle

Abbildung

Auswahlmarkierung

Formel

Barcode

Seitennummer/Seitenkopf/Seitenfuß

PageBreak

Schlüssel-Wert-Paare/Sprache/Stil

Schlussfolgerung

Nächste Schritte

Feedback

Zusätzliche Ressourcen