Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Die Layout-API für Azure Document Intelligence in Foundry Tools kann Ihre Dokumente in rich Markdown umwandeln und dabei deren ursprüngliche Struktur und Formatierung beibehalten. Geben Sie outputContentFormat=markdown einfach in Ihrer Anforderung an, semantisch strukturierte Inhalte zu erhalten, die Absätze, Überschriften, Tabellen und andere Dokumentelemente in ihrer richtigen Hierarchie verwalten.
Mit dieser Markdown-Ausgabe wird die ursprüngliche Organisation des Dokuments elegant erfasst, während standardisierte, einfach konsumierbare Inhalte für downstream-Anwendungen bereitgestellt werden. Die beibehaltene semantische Struktur ermöglicht komplexere Dokumentverarbeitungsworkflows, ohne den Kontext und die Beziehungen zwischen Dokumentelementen zu verlieren.
In der Layoutanalyse unterstützte Markdown-Elemente
Die folgenden Markdown-Elemente sind in Layout-API-Antworten enthalten:
- Paragraph
- Überschrift
- Tabelle
- Abbildung
- Auswahlmarkierung
- Formel
- Barcode
- Seitennummer/Seitenkopf/Seitenfuß
- PageBreak
- Schlüssel-Wert-Paare/Sprache/Stil
- Spans und Inhalt
Paragraph
Absätze stellen zusammenhängende Textblöcke dar, die semantisch zusammengehören. Die Layout-API sorgt für die Integrität von Absätzen, indem:
- Beibehalten von Absatzgrenzen mit leeren Zeilen zwischen getrennten Absätzen
- Verwenden von Zeilenumbrüchen innerhalb von Absätzen zur Beibehaltung der visuellen Struktur des ursprünglichen Dokuments
- Beibehalten eines ordnungsgemäßen Textflusses, der die Lesereihenfolge des Originaldokuments berücksichtigt
Ein Beispiel:
This is paragraph 1.
This is still paragraph 1, even if in another Markdown line.
This is paragraph 2. There is a blank line between paragraph 1 and paragraph 2.
Überschrift
Überschriften organisieren Dokumentinhalte in einer hierarchischen Struktur, um die Navigation und das Verständnis zu vereinfachen. Die Layout-API verfügt über die folgenden Funktionen:
- Verwendet die standardmäßige Markdown-Überschriftensyntax mit 1-6 Hashsymbolen (#), die überschriftenebenen entsprechen.
- Behält den richtigen Abstand mit zwei leeren Zeilen vor jeder Überschrift bei, um die Lesbarkeit zu verbessern.
Ein Beispiel:
# This is a title
## This is heading 1
### This is heading 2
#### This is heading 3
Tabelle
Tabellen bewahren komplexe strukturierte Daten in einem visuell organisierten Format auf. Die Layout-API verwendet html-Tabellensyntax für maximale Genauigkeit und Kompatibilität:
- Implementiert vollständiges HTML-Tabellenmarkup (
<table>,<tr>,<th>,<td>) anstelle standardmäßiger Markdown-Tabellen - Behält verbundene Zelle mit HTML-Rowspan- und Colspan-Attributen bei.
- Behält Tabellenbeschriftungen mit dem
<caption>Tag bei, um den Dokumentkontext aufrechtzuerhalten. - Behandelt komplexe Tabellenstrukturen, einschließlich Kopfzeilen, Zellen und Fußzeilen
- Behält den richtigen Abstand mit zwei leeren Zeilen vor jeder Tabelle bei, um die Lesbarkeit zu verbessern.
- Behält Tabellennoten als separaten Absatz nach der Tabelle bei
Ein Beispiel:
<table>
<caption>Table 1. This is a demo table</caption>
<tr><th>Header</th><th>Header</th></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Footer</td><td>Footer</td></tr>
</table>
This is the footnote of the table.
Abbildung
Die Layout-API behält Abbildungselemente bei:
- Kapselt Abbildungsinhalte in
<figure>Tags, um die semantische Unterscheidung vom umgebenden Text beizubehalten - Behält Abbildungsbeschriftungen mit dem Tag
<figcaption>bei, um wichtigen Kontext bereitzustellen - Behält Fußnoten von Abbildungen als separate Absätze nach dem Abbildungscontainer bei
Von Bedeutung
In Fällen, in denen bestimmte Dokumentkomponenten wie die Abschnittsüberschrift als Teil der Abbildungen erkannt werden, stellt die Markdownausgabe keine Zahlen in der Ausgabe dar und verwendet die Informationen für die Dokumentstrukturanalyse. Zählen Sie in diesen Fällen das Zahlenfeld in JSON auf, um alle Zahlen abzurufen.
Ein Beispiel:
<figure>
<figcaption>Figure 2 This is a figure</figcaption>
Values
300
200
100
0
Jan Feb Mar Apr May Jun Months
</figure>
This is footnote if the figure have.
Auswahlmarkierung
Auswahlzeichen stellen Kontrollkästchen-ähnliche Elemente in Formularen und Dokumenten dar. Die Layout-API:
- Verwendet Unicode-Zeichen zur visuellen Klarheit: ☒ (aktiviert) und ☐ (deaktiviert)
- Filtert Kontrollkästchenerkennungen mit niedriger Vertrauenswürdigkeit (unter 0,1 Konfidenz) aus, um die Zuverlässigkeit zu verbessern.
- Verwaltet die semantische Beziehung zwischen Auswahlzeichen und dem zugehörigen Text.
Formel
Mathematische Formeln bleiben mit laTeX-kompatibler Syntax erhalten, die das Rendern komplexer mathematischer Ausdrücke ermöglicht:
- Inlineformeln werden in einzelne Dollarzeichen (
$...$) eingeschlossen, um den Textfluss aufrechtzuerhalten. - Blockformeln verwenden doppelte Dollarzeichen (
$$...$$) für die eigenständige Anzeige - Mehrzeilige Formeln werden als aufeinander folgende Blockformeln dargestellt, wobei mathematische Beziehungen erhalten bleiben
- Der ursprüngliche Abstand und die Formatierung werden beibehalten, um eine genaue Darstellung sicherzustellen.
Hier sehen Sie ein Beispiel für Inlineformel, einzeiligen Formelblock und mehrzeiligen Formelblock:
The mass-energy equivalence formula $E = m c ^ { 2 }$ is an example of an inline formula
$$\frac { n ! } { k ! \left( n - k \right) ! } = \binom { n } { k }$$
$$\frac { p _ { j } } { p _ { 1 } } = \prod _ { k = 1 } ^ { j - 1 } e ^ { - \beta _ { k , k + 1 } \Delta E _ { k , k + 1 } }$$
$$= \exp \left[ - \sum _ { k = 1 } ^ { j - 1 } \beta _ { k , k + 1 } \Delta E _ { k , k + 1 } \right] .$$
Barcode
Barcodes und QR-Codes werden mithilfe der Markdown-Bildsyntax mit hinzugefügten semantischen Informationen dargestellt:
- Verwendet die standardmäßige Bildmarkdownsyntax mit beschreibenden Attributen
- Erfasst sowohl den Barcodetyp (QR-Code, Barcode usw.) als auch den codierten Wert.
- Behält die semantische Beziehung zwischen Barcodes und umgebendem Inhalt bei
Ein Beispiel:



Seitennummer/Seitenkopf/Seitenfuß
Seitenmetadatenelemente bieten Kontext zur Dokument paginierung, sollten aber nicht inline mit dem Hauptinhalt angezeigt werden:
- Eingeschlossen in HTML-Kommentare, um die Informationen beizubehalten, während sie vom standardmäßigen Markdown-Rendering ausgeblendet bleiben
- Behält ursprüngliche Seitenstrukturinformationen bei, die für die Dokumentrekonstruktion hilfreich sein können
- Ermöglicht Es Anwendungen, die Dokument paginierung zu verstehen, ohne den Inhaltsfluss zu unterbrechen
Ein Beispiel:
<!-- PageHeader="This is page header" -->
<!-- PageFooter="This is page footer" -->
<!-- PageNumber="1" -->
PageBreak
Um leicht herauszufinden, welche Teile zu welcher Seitenbasis auf dem reinen Markdown-Inhalt gehören, haben wir PageBreak als Trennzeichen der Seiten eingeführt.
Ein Beispiel:
<!-- PageBreak -->
Schlüssel-Wert-Paare/Sprache/Stil
Wir ordnen KeyValuePairs/Language/Style dem JSON-Inhalt der Analyse zu und nicht dem Inhalt in Markdown.
Hinweis
Weitere Informationen zu Markdown, die derzeit für Benutzerinhalte auf GitHub.com unterstützt wird, finden Sie unterGitHub Flavored Markdown Spec.
Schlussfolgerung
Die Markdown-Elemente von Document Intelligence bieten eine leistungsstarke Möglichkeit, die Struktur und den Inhalt analysierter Dokumente darzustellen. Indem Sie diese Markdown-Elemente verstehen und ordnungsgemäß verwenden, können Sie Ihre Dokumentverarbeitungsworkflows verbessern und komplexere Inhaltsextraktionsanwendungen erstellen.
Nächste Schritte
Versuchen Sie, Ihre Dokumente mit Document Intelligence Studio zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.