ドキュメント翻訳は、 Azure Translator のクラウドベースの機械翻訳機能です。 元のドキュメント構造とデータ形式を維持しながら、すべてのサポートされている言語と方言で複数の複雑なドキュメントを翻訳できます。 Document Translation API では、2 つの翻訳プロセスがサポートされています。
非同期バッチ翻訳では、複数のドキュメントと大きなファイルの処理がサポートされます。 バッチ翻訳プロセスでは、翻訳前と翻訳後のドキュメント用のストレージ コンテナーを含む Azure Blob Storage アカウントが必要です。
同期単一ファイルでは、単一ファイルの翻訳の処理がサポートされます。 このファイル翻訳プロセスでは、Azure Blob Storage アカウントは必要ありません。 最後の応答に翻訳されたドキュメントが含まれており、それが呼び出し元のクライアントに直接返されます。
主な機能
| 特徴量 | 説明 |
|---|---|
| 大きなファイルを翻訳する | ドキュメント全体を非同期に翻訳します。 |
| 多数のファイルを翻訳する | ドキュメント構造とデータ形式を維持しながら、サポートされているすべての言語と方言の間で複数のファイルを翻訳します。 |
| 画像ファイル形式を翻訳する (プレビュー) 🆕 | • 元のデザインとレイアウトを維持しながら、画像内のテキストを翻訳します。 • サポートされている形式: .jpeg、 .png、 .bmp、 .webp• 価格: 画像ごとに計算されます。 詳細については、「価格」を参照してください。 |
| Word 文書ファイル (.docx) の画像テキストを翻訳します。 | この機能は、ファイル形式の.docx API で使用できます。 |
| ソース ファイルの表示を保持する | 元のレイアウトと形式を維持したままファイルを翻訳します。 |
| カスタム翻訳を適用する | 汎用およびカスタム翻訳モデルを使用してドキュメントを翻訳します。 |
| カスタム用語集を適用する | カスタム用語集を使用してドキュメントを翻訳します。 |
| ドキュメントの言語を自動的に検出する | ドキュメント翻訳サービスでドキュメントの言語を決定します。 |
| コンテンツで複数の言語が使用されているドキュメントを翻訳する | 自動検出機能を使用して、複数の言語のコンテンツが含まれるドキュメントをターゲット言語に翻訳します。 |
開発オプション
利用可能な開発ツールとオプションを利用して、ドキュメント翻訳機能をプロジェクトやアプリケーションに統合します。 この機能を使用すると、プログラムを使用してアプリケーション機能に翻訳機能を実装し、必要に応じてユーザーに多言語サポートを提供できます。
非同期ワークフローを利用して、複数のドキュメントと大きなファイルの並列翻訳を可能にすることで、効率を最適化します。
| 開発オプション | 説明 |
|---|---|
| REST API | REST API は、ドキュメントを翻訳するための HTTP 要求と承認ヘッダーを作成できる、言語に依存しないインターフェイスです。 |
| クライアント ライブラリ (SDK) | クライアント ライブラリ (SDK) は言語固有のクラス、オブジェクト、メソッド、およびコードであり、プロジェクトに参照を追加することですぐに使用できます。 現在、ドキュメント翻訳では 、C#/.NET と Python のプログラミング言語がサポートされています。 |
サポートされているドキュメントと用語集の形式
Batch ドキュメントでサポートされている形式
Get サポートされているドキュメント形式メソッドは、ドキュメント翻訳サービスでサポートされているドキュメント形式の一覧を返します。 一覧には、共通ファイル拡張子と、アップロード API を使用している場合のコンテンツの種類が含まれます。
| ファイルの種類 | ファイル拡張子 | 説明 |
|---|---|---|
| Adobe PDF | pdf |
移植可能なドキュメント ファイル形式。 ドキュメント翻訳では、光学式文字認識 (OCR) テクノロジを使用して、元のレイアウトを保持しながら、スキャンした PDF ドキュメント内のテキストを抽出して翻訳します。 |
| コンマ区切りの値 | csv |
スプレッドシート プログラムによって使用される、コンマ区切りの生データ ファイル。 |
| HTML |
html、htm |
ハイパー テキスト マークアップ言語。 |
| 画像 (2025-12-01-プレビュー) |
.jpeg、 .png、 .bmp、 .webp |
デジタル画像データを格納するファイル。 |
| OpenDocument プレゼンテーション | odp |
オープンソースのプレゼンテーション ファイル。 |
| OpenDocument スプレッドシート | ods |
オープンソースのスプレッドシート ファイル。 |
| OpenDocument テキスト | odt |
オープンソースのテキスト ドキュメント ファイル。 |
| Markdown |
markdown、 mdown、 mkdn、 md、 mkd、 mdwn、 mdtxt、 mdtext、 rmd |
書式設定されたテキストを作成するための軽量マークアップ言語。 |
| MHTML |
mhtml、mht |
HTML コードとその関連リソースを結合するために使用される Web ページ アーカイブ形式。 |
| Microsoft Excel |
xls、xlsx |
データ分析とドキュメント用のスプレッドシート ファイル。 |
| Microsoft Outlook | msg |
Microsoft Outlook で作成または保存された電子メール メッセージ。 |
| Microsoft PowerPoint |
ppt、pptx |
スライドショー形式でコンテンツを表示するために使用されるプレゼンテーション ファイル。 |
| マイクロソフトワード |
doc、docx |
テキスト ドキュメント ファイル。 |
| リッチ テキスト形式 | rtf |
書式設定を含むテキスト ドキュメント。 |
| タブ区切り値/TAB | tsv/tab |
スプレッドシート プログラムによって使用される、タブ区切りの生データ ファイル。 |
| テキスト | txt |
書式設定のないテキスト ドキュメント。 |
XML ローカライズインターチェンジ ファイル形式 |
xlff |
並列ドキュメント形式、翻訳メモリ システムのエクスポート。 使用される言語はファイル内で定義されています。 |
バッチ レガシ ファイルの種類
ソース ファイルの種類は、以下の例外を除いて、ドキュメントの翻訳中に保持されます。
| ソース ファイルの拡張子 | 翻訳されたファイルの拡張子 |
|---|---|
| .doc、.odt、.rtf、 | .docx |
| .xls、.ods | .xlsx |
| .ppt、.odp | .pptx |
Batch 用語集でサポートされている形式
ドキュメント翻訳では、次の用語集のファイルの種類がサポートされています。
| ファイルの種類 | ファイル拡張子 | 説明 |
|---|---|---|
| コンマ区切りの値 | csv |
スプレッドシート プログラムによって使用される、コンマ区切りの生データ ファイル。 |
XML ローカライズインターチェンジ ファイル形式 |
xlf , xliff |
並列ドキュメント形式の、翻訳メモリ システムのエクスポート。使用される言語は、ファイル内で定義されます。 |
| タブ区切りの値/TAB |
tsv、tab |
スプレッドシート プログラムによって使用される、タブ区切りの生データ ファイル。 |
ドキュメント翻訳要求の制限
Azure Translator 要求の制限の詳細については、「ドキュメント翻訳要求の制限」を参照してください。
ドキュメント翻訳データの保存場所
ドキュメント翻訳データの保存場所は、Translator リソースが作成された Azure リージョンによって異なります。
✔️ 機能: ドキュメント翻訳
✔️サービス エンドポイント: カスタム: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
| リソースによって作成されたリージョン | 要求処理データ センター |
|---|---|
| グローバル | 最も近い利用可能なデータセンター。 |
| 南北アメリカ | 米国東部 2 • 米国西部 2 |
| アジア太平洋 | 東日本 • 東南アジア |
| ヨーロッパ (スイスを除く) | フランス中部 • 西ヨーロッパ |
| スイス | スイス北部 • スイス西部 |
次のステップ
クイック スタートでは、ドキュメント翻訳の使用を迅速に開始する方法について説明します。 開始するには、アクティブな Azure アカウントが必要です。 アカウントがない場合は、無料アカウントを作成することができます。