文件翻譯是 Azure Translator 的雲端機器翻譯功能。 您可以翻譯所有支援的語言和方言的多個複雜文件,同時保留原始文件結構和資料格式。 文件翻譯 API 支援兩種翻譯流程:
異步批次翻譯支援多個文件和大型檔案的處理。 批次翻譯流程需要具有來源和翻譯文件儲存體容器的 Azure Blob 儲存體帳戶。
同步單一檔案支援單一檔案翻譯的處理。 檔案翻譯流程不需要 Azure Blob 儲存體帳戶。 最終回應包含已翻譯的文件,並會直接傳回給呼叫用戶端。
主要功能
| 功能 | 描述 |
|---|---|
| 翻譯大型檔案 | 以非同步方式翻譯整份文件。 |
| 翻譯許多檔案 | 翻譯所有支援語言和方言的多個檔案,同時保留文件結構和資料格式。 |
| 翻譯影像檔案格式(預覽) 🆕 | • 在保持原始設計與版面的同時,翻譯圖片中的文字。 • 支援格式: .jpeg、、 .png.bmp.webp• 價格:以每張圖片計算。 更多 資訊請參閱定價 |
| 翻譯 Word 文件中的圖片文字(.docx)。 | 此功能適用於批次文件翻譯 API,支援.docx檔案格式的翻譯。 |
| 保留來源檔案簡報 | 翻譯檔案,同時保留原始的版面配置和格式。 |
| 套用自訂翻譯 | 使用一般和自訂翻譯模型來翻譯文件。 |
| 套用自訂字彙 | 使用自訂字彙翻譯文件。 |
| 自動偵測文件語言 | 讓檔案翻譯服務判斷檔的語言。 |
| 翻譯內容包含多種語言的文件 | 您可以使用自動偵測功能,將內容包含多種語言的文件翻譯成您的目標語言。 |
開發選項
利用現有的開發工具與選項,將文件翻譯功能整合進您的專案與應用程式中。 此功能允許您在應用程式功能中以程式化方式實作翻譯功能,並根據需要提供多語言支援。
透過非同步工作流程優化效率,實現多份文件與大型檔案的平行翻譯。
| 開發選項 | 描述 |
|---|---|
| REST API | REST API 是一個語言無關介面,讓你能建立 HTTP 請求和授權標頭來翻譯文件。 |
| 用戶端函式庫(SDK) | 客戶端函式庫(SDK)是語言特定的類別、物件、方法和程式碼,你可以透過在專案中新增參考來快速使用。 目前 Document translation 支援 C#/.NET 和 Python 程式語言。 |
支援的文件與詞彙表格式
批次文件支援格式
Get 支援的檔案格式方法會傳回檔案翻譯服務支援的檔案格式清單。 此清單包含通用副檔名,以及使用上傳 API 時的 content-type。
| 檔案類型 | 副檔名 | 描述 |
|---|---|---|
| Adobe PDF | pdf |
可攜式文件檔案格式。 文件翻譯會使用光學字元辨識 (OCR) 技術來擷取和翻譯掃描 PDF 文件中的文字,同時保留原始版面配置。 |
| 逗點分隔值 | csv |
試算表程式所使用的逗點分隔原始資料檔案。 |
| HTML |
html、htm |
超文字標記語言。 |
| 圖片(2025-12-01-預覽) |
.jpeg、.png、.bmp、.webp |
儲存數位影像資料的檔案。 |
| OpenDocument 簡報 | odp |
開放原始碼展示檔。 |
| OpenDocument 試算表 | ods |
開放原始碼試算表檔案。 |
| OpenDocument 文字 | odt |
開放原始碼的文字文件檔案。 |
| Markdown |
markdown、mdown、mkdn、md、mkd、mdwn、mdtxt、mdtext、rmd |
用於建立格式化文字的輕量標記語言。 |
| MHTML |
mhtml、mht |
用來合併 HTML 程式碼與其附屬資源的網頁封存格式。 |
| Microsoft Excel |
xls、xlsx |
用於資料分析和文件的試算表檔案。 |
| Microsoft Outlook | msg |
在 Microsoft Outlook 內建立或儲存的電子郵件訊息。 |
| Microsoft PowerPoint |
ppt、pptx |
用來以投影片格式顯示內容的簡報檔案。 |
| Microsoft Word |
doc、docx |
文字文件檔案。 |
| RTF 格式 | rtf |
包含格式的文字文件。 |
| 定位字元分隔值/TAB | tsv/tab |
試算表程式所使用的逗點分隔原始資料檔案。 |
| 文字 | txt |
未格式化的文字文件。 |
XML 當地語系化交換檔案格式 |
xlff |
平行文件格式,翻譯記憶體系統的匯出。 使用的語言定義於檔案內。 |
批次舊版檔案類型
在文件翻譯期間會保留來源檔案類型,但有下列例外:
| 來源檔案副檔名 | 翻譯檔案的副檔名 |
|---|---|
| .doc、.odt、.rtf、 | .docx |
| .xls, .ods | .xlsx |
| .ppt, .odp | .pptx |
批次詞彙表支援格式
檔案翻譯支援下列字彙檔案類型:
| 檔案類型 | 副檔名 | 描述 |
|---|---|---|
| 逗點分隔值 | csv |
試算表程式所使用的逗點分隔原始資料檔案。 |
XML 當地語系化交換檔案格式 |
xlf 、xliff |
平行文件格式,匯出翻譯記憶體系統,所使用語言是在檔案中定義。 |
| 定位字元分隔值/TAB |
tsv、tab |
試算表程式所使用的逗點分隔原始資料檔案。 |
檔翻譯要求限制
有關 Azure Translator 請求限制的詳細資訊, 請參見文件翻譯請求限制。
文件翻譯資料存放位置
檔案翻譯的資料存放地取決於您建立 Azure 翻譯服務資源所在的區域。
✔️ 功能: 檔案翻譯
✔️服務端點: 自訂: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
| 資源建立的區域 | 要求處理資料中心 |
|---|---|
| 全域 | 最接近的可用資料中心。 |
| 美洲 | 美國東部 2 • 美國西部 2 |
| 亞太地區 | 日本東部 • 東南亞 |
| 歐洲 (瑞士除外) | 法國中部 • 西歐 |
| 瑞士 | 瑞士北部 • 瑞士西部 |
後續步驟
在我們的快速入門中,您將瞭解如何快速開始使用文件翻譯。 若要開始,您需要使用中的 Azure 帳戶。 如果您沒有帳戶,您可以建立免費帳戶。