문서 번역은 Azure Translator의 클라우드 기반 기계 번역 기능입니다. 원래 문서 구조와 데이터 형식은 유지하면서 모든 지원되는 언어에서 복잡한 여러 문서를 번역할 수 있습니다. 문서 번역 API는 두 가지 번역 프로세스를 지원합니다.
비동기 일괄 처리 번역은 여러 문서와 대용량 파일의 처리를 지원합니다. 일괄 처리 번역 프로세스에는 원본 및 번역된 문서에 대한 스토리지 컨테이너가 포함된 Azure Blob Storage 계정이 필요합니다.
동기식 단일 파일은 단일 파일 번역 처리를 지원합니다. 파일 번역 프로세스에는 Azure Blob Storage 계정이 필요하지 않습니다. 최종 응답은 번역된 문서를 포함하고 호출 클라이언트에 직접 반환됩니다.
주요 기능
| 기능 | 설명 |
|---|---|
| 대용량 파일 번역 | 전체 문서를 비동기적으로 번역합니다. |
| 대용량 파일 번역 | 문서 구조와 데이터 형식을 유지하면서 지원되는 모든 언어와 방언으로 여러 파일을 번역합니다. |
| 이미지 파일 형식 번역(미리 보기) 🆕 | • 원래 디자인과 레이아웃을 유지하면서 이미지 내에서 텍스트를 번역합니다. • 지원되는 형식: .jpeg, .png, .bmp.webp• 가격 책정: 이미지별로 계산됩니다. 자세한 내용은 가격 책정을 참조하세요. |
| Word 문서 파일(.docx)에서 이미지 텍스트를 번역합니다. | 이 기능은 파일 형식에 대한 .docx API와 함께 사용할 수 있습니다. |
| 원본 파일 프레젠테이션 보존 | 원래 레이아웃과 형식을 유지하면서 파일을 번역합니다. |
| 사용자 지정 번역 적용 | 일반 및 사용자 지정 번역 모델을 사용하여 문서를 번역합니다. |
| 사용자 지정 글로서리 적용 | 사용자 지정 글로서리를 사용하여 문서를 번역합니다. |
| 문서 언어 자동 검색 | 문서 번역 서비스에서 문서의 언어를 결정하도록 합니다. |
| 여러 언어로 된 콘텐츠가 있는 문서 번역 | 자동 검색 기능을 사용하여 여러 언어로 된 콘텐츠가 있는 문서를 대상 언어로 번역합니다. |
개발 옵션
사용 가능한 개발 도구 및 옵션을 활용하여 문서 번역 기능을 프로젝트 및 애플리케이션에 통합합니다. 이 기능을 사용하면 애플리케이션 기능에서 번역 기능을 프로그래밍 방식으로 구현하고 필요에 따라 사용자에게 다국어 지원을 제공할 수 있습니다.
비동기 워크플로를 활용하여 효율성을 최적화하여 여러 문서 및 대용량 파일을 병렬로 변환할 수 있습니다.
| 개발 옵션 | 설명 |
|---|---|
| REST API | REST API는 HTTP 요청 및 권한 부여 헤더를 만들어 문서를 번역할 수 있는 언어 독립적 인터페이스입니다. |
| 클라이언트 라이브러리(SDK) | SDK(클라이언트 라이브러리)는 프로젝트에 참조를 추가하여 빠르게 사용할 수 있는 언어별 클래스, 개체, 메서드 및 코드입니다. 현재 문서 번역에는 C#/.NET 및 Python에 대한 프로그래밍 언어 지원이 있습니다. |
지원되는 문서 및 용어집 형식
Batch 문서 지원 형식
지원되는 문서 서식 가져오기 메서드는 문서 번역 서비스에서 지원하는 문서 형식 목록을 반환합니다. 이 목록에는 공용 파일 확장명 및 업로드 API를 사용하는 경우 콘텐츠 형식이 포함되어 있습니다.
| 파일 형식 | 파일 확장명 | 설명 |
|---|---|---|
| Adobe PDF | pdf |
이식 가능한 문서 파일 형식입니다. 문서 번역기는 OCR(광학 인식) 기술을 사용하여 원본 레이아웃을 유지하면서 스캔한 PDF 문서에서 텍스트를 추출하고 번역합니다. |
| 쉼표로 구분된 값 | csv |
스프레드시트 프로그램에서 사용하는 쉼표로 구분된 원시 데이터 파일입니다. |
| HTML |
html, htm |
Hyper Text Markup Language |
| 이미지(2025-12-01-프리뷰) |
.jpeg, .png, , .bmp, .webp |
디지털 이미지 데이터를 저장하는 파일입니다. |
| OpenDocument 프레젠테이션 | odp |
오픈 소스 프레젠테이션 파일입니다. |
| OpenDocument 스트레드시트 | ods |
오픈 소스 스프레드시트 파일입니다. |
| OpenDocument 텍스트 | odt |
오픈 소스 텍스트 문서 파일입니다. |
| Markdown |
markdown,mdown, mkdn, md, mkd, mdwnmdtxt, mdtextrmd |
서식이 지정된 텍스트를 만들기 위한 간단한 태그 언어입니다. |
| MHTML |
mhtml, mht |
HTML 코드와 포함 리소스를 결합하는 데 사용되는 웹 페이지 보관 형식입니다. |
| Microsoft Excel |
xls, xlsx |
데이터 분석 및 설명서에 대한 스프레드 시트 파일입니다. |
| 마이크로소프트 아웃룩 | msg |
Microsoft Outlook 내에서 만들어지거나 저장된 이메일 메시지입니다. |
| Microsoft PowerPoint |
ppt, pptx |
슬라이드 쇼 형식으로 콘텐츠를 표시하는 데 사용되는 프레젠테이션 파일입니다. |
| 마이크로소프트 워드 |
doc, docx |
텍스트 문서 파일입니다. |
| 서식 있는 텍스트 형식 | rtf |
서식을 포함하는 텍스트 문서입니다. |
| 탭으로 구분된 값/TAB | tsv/tab |
스프레드시트 프로그램에서 사용하는 탭으로 구분된 원시 데이터 파일입니다. |
| 문자 메시지 | txt |
서식이 지정되지 않은 텍스트 문서입니다. |
XML 지역화 교환 파일 형식 |
xlff |
번역 메모리 시스템에서 내보낸 병렬 문서 형식입니다. 사용되는 언어는 파일 안에 정의되어 있습니다. |
일괄 처리 레거시 파일 형식
원본 파일 형식은 다음을 제외하고 문서 번역 중에 유지됩니다.
| 원본 파일 확장명 | 번역된 파일 확장명 |
|---|---|
| .doc, .odt, .rtf, | .docx |
| .xls, .ods | .xlsx |
| .ppt, .odp | .pptx |
Batch 용어집 지원 형식
문서 번역은 다음과 같은 용어집 파일 형식을 지원합니다.
| 파일 형식 | 파일 확장명 | 설명 |
|---|---|---|
| 쉼표로 구분된 값 | csv |
스프레드시트 프로그램에서 사용하는 쉼표로 구분된 원시 데이터 파일입니다. |
XML 지역화 교환 파일 형식 |
xlf , xliff |
번역 메모리 시스템에서 내보낸 병렬 문서 형식입니다. 사용되는 언어는 파일 내에 정의되어 있습니다. |
| 탭으로 구분된 값/TAB |
tsv, tab |
스프레드시트 프로그램에서 사용하는 탭으로 구분된 원시 데이터 파일입니다. |
문서 번역 요청 제한
Azure Translator 요청 제한에 대한 자세한 내용은 문서 번역 요청 제한을참조하세요.
문서 번역 데이터 저장 위치
문서 번역 데이터 보존은 Translator 리소스가 만들어진 Azure 지역에 따라 달라집니다.
✔️ 기능: 문서 번역
✔️ 서비스 엔드포인트: 사용자 지정: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
| 리소스를 만든 지역 | 요청 처리 데이터 센터 |
|---|---|
| 글로벌 | 가장 가까운 사용 가능한 데이터 센터입니다. |
| 아메리카 | 미국 동부 2 • 미국 서부 2 |
| 아시아 태평양 | 일본 동부 • 동남 아시아 |
| 유럽(스위스 제외): | 프랑스 중부 • 서유럽 |
| 스위스 | 스위스 북부 • 스위스 서부 |
다음 단계
빠른 시작에서는 문서 번역을 빠르게 시작하는 방법을 알아봅니다. 시작하려면 활성 Azure 계정이 필요합니다. 계정이 없는 경우 무료 계정에 만들 수 있습니다.