Foundry Tools의 Azure Content Understanding은 정확한 다운스트림 사용을 위해 콘텐츠 및 레이아웃을 유지하면서 구조화되지 않은 문서를 GitHub Flavored Markdown으로 변환합니다. 이 문서에서는 Markdown에서 각 콘텐츠 및 레이아웃 요소를 나타내는 방법을 설명합니다.
단어 및 선택 표시
인식된 단어와 검색된 선택 표시는 Markdown에서 일반 텍스트로 표현됩니다. 선택 표시는 ☒(선택됨) 및 ☐(선택 취소됨) 유니코드 문자를 사용하여 인코딩됩니다. Markdown 서식 지정 구문의 모호성을 방지하기 위해 콘텐츠를 이스케이프할 수 있습니다.
바코드
바코드는 대체 텍스트와 제목 이 있는 Markdown 이미지로 표현됩니다.
| 콘텐츠 형식 | Markdown 패턴 | 예시 |
|---|---|---|
| 바코드 |  |
 |
수식
수학 수식은 Markdown에서 LaTeX를 사용하여 인코딩됩니다.
- 인라인 수식은 텍스트 흐름을 유지하기 위해 1달러 기호(
$...$)로 묶입니다. - 디스플레이 수식은 독립 실행형 디스플레이에 이중 달러 기호(
$$...$$)를 사용합니다. - 여러 줄 수식은 빈 줄을 개입하지 않고 연속된 표시 수식으로 표현됩니다. 이 구조는 수학적 관계를 유지합니다.
| 수식 종류 | 마크다운 | 시각화 |
|---|---|---|
| 인라인 | $\sqrt { -1 } $ is $i$ |
$\sqrt { -1 } $는 $i$입니다. |
| 디스플레이 | $$a^2 + b^2 = c^2$$ |
$a^2 + b^2 = c^2$ |
| 여러 줄 | $$( x + 2 ) ^ 2 = x ^ 2 + 4 x + 4$$$$= x ( x + 4 ) + 4$$ |
$$( x + 2 ) ^ 2 = x ^ 2 + 4 x + 4$$ $$= x ( x + 4 ) + 4$$ |
이미지
검색된 이미지(그림 및 차트 포함)는 표준 Markdown 이미지 구문을 사용하여 표시됩니다. 대체 텍스트는 그림 내에서 검색된 텍스트를 포함하며 구문은 구성 옵션에 따라 달라집니다.
이미지 표현 패턴
| 구성 / 설정 | Markdown 패턴 | Description |
|---|---|---|
| 기초 |  |
설명이 없는 표준 이미지 |
| 도형 설명 활성화 |  |
생성된 이미지 설명 포함 |
| 도형 설명 활성화 + 도형 분석 활성화 |
 뒤에 차트, Markdown 테이블 또는 Mermaid 다이어그램이 옵니다. |
설명 및 추가된 그림 분석이 있는 이미지(차트, 테이블 또는 다이어그램) |
| enableFigureAnalysis만 |
 뒤에 차트, Markdown 테이블 또는 Mermaid 다이어그램이 옵니다. |
설명 및 추가된 그림 분석이 없는 이미지(차트, 테이블 또는 다이어그램) |
예시
enableFigureDescription이 없는 이미지

enableFigureDescription이 있는 이미지

enableFigureDescription 및 enableFigureAnalysis를 사용하는 이미지

옵션 1: 차트 그림 분석
{ ...chart config... }
옵션 2: Markdown 테이블 그림 분석
| Month | Value |
|-------|-------|
| Jan | 100 |
| Feb | 150 |
| Mar | 200 |
| Apr | 250 |
| May | 300 |
| Jun | 275 |
enableFigureDescription 및 enableFigureAnalysis가 없는 이미지

```mermaid
{ ...mermaid diagram... }
그림 분석
문서에서 검색된 차트 및 다이어그램은 특수 렌더링 형식의 구조화된 그림 콘텐츠로 표시됩니다.
차트
차트는 JSON 형식의 Chart.js 구문을 사용하여 그림 콘텐츠로 표시됩니다. 설정(config.chartFormat또는chartJs)에 markdown 따라 차트를 Chart.js 코드 블록 또는 Markdown 테이블로 나타낼 수 있습니다.
Chart.js 형식(chartFormat=chartJs)
{
"type": "bar",
"data": {
"labels": ["Jan", "Feb", "Mar", "Apr", "May", "Jun"],
"datasets": [{
"label": "Values",
"data": [100, 150, 200, 250, 300, 275],
"backgroundColor": "rgba(54, 162, 235, 0.2)",
"borderColor": "rgba(54, 162, 235, 1)",
"borderWidth": 1
}]
},
"options": {
"scales": {
"y": {
"beginAtZero": true
}
}
}
}
Markdown 테이블 형식(chartFormat=markdown)
| Month | 가치들 |
|---|---|
| 1월 | 100 |
| 2월 | 150 |
| 3월 | 200 |
| 4월 | 250 |
| 5월 | 300 |
| 6월 | 275 |
다이어그램
다이어그램은 인어 구문을 사용하여 그림 콘텐츠에 표시되고 Markdown에서 인어 코드 블록으로 렌더링됩니다.
graph TD
A[Start] --> B{Decision}
B -->|Yes| C[Action 1]
B -->|No| D[Action 2]
C --> E[End]
D --> E
렌더링 지원
인기 있는 Markdown 확장 및 뷰어는 Chart.js 및 인어 코드 블록의 시각적 렌더링을 지원합니다.
- Chart.js: 대화형 차트 및 그래프 렌더링
- 인어: 순서도, 시퀀스 다이어그램 및 기타 다이어그램 형식을 렌더링합니다.
- 대부분의 최신 Markdown 프로세서에는 두 형식 모두에 대한 플러그 인이 포함됩니다.
줄 및 단락
단락은 Markdown에서 빈 줄로 구분된 텍스트 블록으로 표현됩니다. 줄을 사용할 수 있는 경우 각 문서 줄은 Markdown의 별도 줄에 매핑됩니다.
섹션
제목 또는 섹션 제목 역할이 있는 단락은 Markdown 제목으로 변환됩니다. 제목(있는 경우)은 수준-1 제목으로 할당됩니다. 검색된 계층 구조를 유지하기 위해 다른 모든 섹션의 제목 수준이 할당됩니다.
테이블
표는 현재 HTML 표 태그(<table>, <tr>, <th> 및 <td>)를 사용하여 Markdown으로 표현되어 rowspan 및 colspan 특성을 통해 병합된 셀을 지원하고 <th> 특성을 통해 서식 있는 헤더를 지원할 수 있습니다. 모든 캡션은 <caption> 요소를 통해 표현됩니다. 연결된 각주가 표 바로 뒤의 텍스트로 표시됩니다.
<table>
<caption>Table 1. Example</caption>
<tr><th>Header A</th><th>Header B</th></tr>
<tr><td>Cell 1A</td><td>Cell 1B</td></tr>
<tr><td>Cell 2A</td><td>Cell 2B</td></tr>
</table>
This is a footnote.
| 헤더 A | 헤더 B |
|---|---|
| 셀 1A | 셀 1B |
| 셀 2A | 셀 2B |
페이지 메타데이터
Markdown은 페이지 번호, 머리글, 꼬리말 및 페이지 나누기와 같은 페이지 관련 메타데이터를 원래 인코딩하지 않습니다. 이 정보는 다운스트림 애플리케이션에 유용할 수 있으므로 HTML 주석과 같은 메타데이터를 인코딩합니다.
| 메타데이터 | 마크다운 |
|---|---|
| 페이지 번호 | <!-- PageNumber="1" --> |
| 페이지 머리글 | <!-- PageHeader="Header" --> |
| 페이지 바닥글 | <!-- PageNumber="Footer" --> |
| 페이지 나누기 | <!-- PageBreak --> |
Hyperlinks
디지털 콘텐츠에서 검색된 하이퍼링크는 표준 Markdown 링크 구문을 사용하여 표시됩니다. 서비스는 원본 문서의 표시 텍스트와 대상 URL을 모두 유지합니다.
| 연결 종류 | Markdown 패턴 | 예시 |
|---|---|---|
| 표준 링크 | [display text](url) |
[Visit Microsoft](https://www.microsoft.com) |
예시
For more information, visit the [Microsoft Foundry](https://aka.ms/ai-foundry) portal.
Contact our support team at [support@contoso.com](mailto:support@contoso.com "Email support").
See the [official documentation][docs] for detailed instructions.
[docs]: https://docs.microsoft.com
Annotations
매개 변수로 제어 annotationFormat 되는 다양한 형식을 사용하여 Markdown에서 강조 표시, 밑줄 및 주석과 같은 문서 주석을 나타낼 수 있습니다.
주석 형식
| 포맷 | Description | 사용 사례 |
|---|---|---|
none |
Markdown에 주석 정보 없음 | 주석 표현에 대한 모든 권한 |
frontMatter |
HTML 스팬이 포함된 YAML 프론트 매터의 주석 | 전체 문서 컨텍스트를 사용하는 간단한 RAG 시나리오 |
markdown |
기본 Markdown 표기 구문 | 표준 Markdown 호환성 |
형식: 없음
설정 annotationFormat=none하면 Markdown에 주석 정보가 포함되지 않습니다. 주석을 추출하려면 enableAnnotation와 returnDetails을 true로 모두 설정하십시오.
This is the document content without any annotation markers.
Use the annotations JSON property to customize representation.
형식: frontMatter(기본값)
주석 세부 정보를 참조하는 특성을 포함하는 id HTML 범위를 사용하여 YAML 프런트 매터의 주석을 인코딩합니다.
---
fields:
title: "Document Title"
annotations:
- id: underline-1
author: Paul
type: underline
comments:
- message: "Please review this section"
author: Paul
tags: "approved,👍3"
- id: highlight-2
author: Sarah
type: highlight
comments:
- message: "Important information"
author: Sarah
---
This is <span id="underline-1">underlined text</span> in the document.
This section contains <span id="highlight-2">highlighted content</span> for emphasis.
<!-- Annotations without spans appear at page end -->
<span id="note-3" />
형식: markdown
대상 Markdown 프로세서에서 지원되는 경우 주석에 네이티브 Markdown 구문을 사용합니다.
This text has ==highlighted content== for emphasis.
This text has ++underlined content++ for attention.
> **Note:** This is an annotation comment.
결론
콘텐츠 이해 Markdown 요소는 분석된 문서의 구조와 콘텐츠를 나타내는 강력한 방법을 제공합니다. 이러한 Markdown 요소를 제대로 이해하고 사용하는 경우 문서 처리 워크플로를 향상시킬 수 있습니다. 보다 정교한 콘텐츠 추출 애플리케이션을 빌드할 수도 있습니다.
관련 콘텐츠
- Content Understanding Studio를 사용하여 문서 콘텐츠를 처리해 보세요.
- Content Understanding Studio 빠른 시작을 확인하세요.
- 분석기 템플릿을 사용하여 문서 콘텐츠를 분석하는 방법을 알아봅니다.
- 시각적 문서 검색을 사용하여 코드 샘플을 검토합니다.
- 코드 샘플 분석기 템플릿을 검토합니다.