Freigeben über


Was ist Azure Translator in Foundry Tools-Dokumentübersetzung?

Die Dokumentübersetzung ist ein cloudbasiertes Maschinelles Übersetzungsfeature von Azure Translator. Sie können mehrere und komplexe Dokumente in allen unterstützten Sprachen und Dialekten übersetzen und dabei die ursprüngliche Dokumentstruktur und das Datenformat beibehalten. Die Dokumentübersetzung-API unterstützt zwei Übersetzungsprozesse:

  • Die asynchrone Batchübersetzung unterstützt die Verarbeitung mehrerer Dokumente und großer Dateien. Für den Batchübersetzungsprozess ist ein Azure Blob-Speicherkonto mit Speichercontainern für Ihre Quell- und übersetzten Dokumente erforderlich.

  • Die synchrone Einzeldateiübersetzung unterstützt die Verarbeitung einzelner Dateiübersetzungen. Für den Dateiübersetzungsprozess ist kein Azure Blob Storage-Konto erforderlich. Die endgültige Antwort enthält das übersetzte Dokument und wird direkt an den aufrufenden Client zurückgegeben.

Wichtigste Funktionen

Funktion BESCHREIBUNG
Große Dateien übersetzen Übersetzen Sie ganze Dokumente asynchron.
Zahlreiche Dateien übersetzen Übersetzen Sie mehrere Dateien in und aus allen unterstützten Sprachen und Dialekten unter Beibehaltung der Dokumentstruktur und des Datenformats.
Übersetzen von Bilddateiformaten (Vorschau) 🆕 Übersetzen von Text in einem Bild unter Beibehaltung des ursprünglichen Designs und Layouts.
Unterstützte Formate: .jpeg, , .png.bmp.webp
Preise: Berechnet auf Bildbasis. Weitere Informationen finden Sie unterPreise
Übersetzen von Bildtext in Word-Dokumentdateien (.docx). Dieses Feature ist mit der Batchdokumentübersetzungs-API für das .docx Dateiformat verfügbar.
Darstellung der Quelldatei beibehalten Übersetzen Sie Dateien unter Beibehaltung des ursprünglichen Layouts und Formats.
Benutzerdefinierte Übersetzung anwenden Übersetzen Sie Dokumente mithilfe von allgemeinen und benutzerdefinierten Übersetzungsmodellen.
Benutzerdefinierte Glossare anwenden Übersetzen Sie Dokumente mithilfe von benutzerdefinierten Glossaren.
Dokumentsprache automatisch erkennen Lassen Sie den Dokumentübersetzungsdienst die Sprache des Dokuments bestimmen.
Übersetzen von Dokumenten mit Inhalt in mehreren Sprachen Mit dem Feature zur automatischen Erkennung können Sie Dokumente mit mehrsprachigem Inhalt in Ihre Zielsprache übersetzen.

Entwicklungsoptionen

Integrieren Sie Dokumentübersetzungsfunktionen in Ihre Projekte und Anwendungen, indem Sie verfügbare Entwicklungstools und -optionen verwenden. Mit diesem Feature können Sie Übersetzungsfeatures programmgesteuert in Ihre Anwendungsfunktionalität implementieren und Benutzern bei Bedarf mehrsprachige Unterstützung bieten.

Optimieren Sie die Effizienz, indem Sie asynchrone Workflows verwenden, um die parallele Übersetzung mehrerer Dokumente und großer Dateien zu ermöglichen.

Entwicklungsoption BESCHREIBUNG
REST-API Die REST-API ist eine sprachunabhängige Schnittstelle, mit der Sie HTTP-Anforderungen und Autorisierungsheader zum Übersetzen von Dokumenten erstellen können.
Clientbibliotheken (SDKs) Die Clientbibliothek (SDKs) sind sprachspezifische Klassen, Objekte, Methoden und Code, die Sie schnell verwenden können, indem Sie ihrem Projekt einen Verweis hinzufügen. Derzeit unterstützt die Dokumentübersetzung Programmiersprachen für C#/.NET und Python.

Unterstützte Dokument- und Glossarformate

Unterstützte Batchdokumentformate

Die Methode "Unterstützte Dokumentformate abrufen " gibt eine Liste von Dokumentformaten zurück, die vom Dokumentübersetzungsdienst unterstützt werden. Die Liste enthält die gemeinsame Dateierweiterung und den Inhaltstyp, wenn die Upload-AP verwendet wird.

Dateityp Dateierweiterung BESCHREIBUNG
Adobe PDF pdf Portable Document File-Format Bei der Dokumentübersetzung wird OCR-Technologie (Optical Character Recognition, optische Zeichenerkennung) verwendet, um Text in gescannten PDF-Dokumenten zu extrahieren und zu übersetzen, während das ursprüngliche Layout beibehalten wird.
Durch Trennzeichen getrennte Datei csv Eine durch Trennzeichen getrennte Datei mit Rohdaten, die von Tabellenkalkulationsprogrammen verwendet wird.
HTML html, htm HyperText Markup Language.
Bild (Vorschau vom 2025-12-01) .jpeg .png .bmp .webp Dateien, die digitale Bilddaten speichern.
OpenDocument-Präsentation odp Eine Open-Source-Präsentationsdatei
OpenDocument-Arbeitsblatt ods Eine Open-Source-Tabellendatei
OpenDocument-Text odt Eine Open-Source-Textdokumentdatei
Markdown markdown, mdown, mkdnmd, mkd, mdwn, mdtxt, mdtextrmd Eine leichtgewichtige Markupsprache zum Erstellen von formatiertem Text
MHTML mhtml, mht Ein Webseitenarchivformat, das zum Kombinieren von HTML-Code und zugehörigen Ressourcen verwendet wird
Microsoft Excel xls, xlsx Eine Tabellenkalkulationsdatei zur Datenanalyse und Dokumentation.
Microsoft Outlook msg Eine E-Mail-Nachricht, die in Microsoft Outlook erstellt oder gespeichert wurde.
Microsoft PowerPoint ppt, pptx Eine Präsentationsdatei, die zur Anzeige von Inhalten in einem Präsentationsformat verwendet wird.
Microsoft Word doc, docx Eine Textdokumentdatei.
Rich-Text-Format rtf Ein Textdokument mit Formatierungen.
Durch Tabstopp getrennte Werte/TAB tsv/tab Eine durch Tabulator getrennte Datei mit Rohdaten, die von Tabellenkalkulationsprogrammen verwendet wird.
Text txt Ein unformatiertes Textdokument.
XML Lokalisierungsaustauschdateiformat xlff Ein Format für parallele Dokumente, das auch Translation Memory-Systeme exportiert. Die verwendeten Sprachen werden in der Datei definiert.

Legacydateitypen für die Batchübersetzung

Der Quelldateityp wird während der Dokumentübersetzung beibehalten, dabei gelten folgende Ausnahmen:

Quelldateierweiterung Erweiterung der übersetzten Datei
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Batch-Glossar unterstützte Formate

Die Dokumentübersetzung unterstützt die folgenden Glossardateitypen:

Dateityp Dateierweiterung BESCHREIBUNG
Durch Trennzeichen getrennte Datei csv Eine durch Trennzeichen getrennte Datei mit Rohdaten, die von Tabellenkalkulationsprogrammen verwendet wird.
XML Lokalisierungsaustauschdateiformat xlf , xliff Ein Format für parallele Dokumente, das auch Translation Memory-Systeme exportiert. Die verwendeten Sprachen werden in der Datei definiert.
Durch Tabstopp getrennte Werte tsv, tab Eine durch Tabulator getrennte Datei mit Rohdaten, die von Tabellenkalkulationsprogrammen verwendet wird.

Grenzwerte für Dokumentübersetzungsanforderungen

Ausführliche Informationen zu Azure Translator-Anforderungsbeschränkungen finden Sie unterGrenzwerte für Dokumentübersetzungsanforderungen.

Datenresidenz von Dokumentübersetzung

Die Aufbewahrung von Dokumentübersetzungsdaten hängt von der Azure-Region ab, in der Ihre Übersetzerressource erstellt wurde:

✔️ Feature: Endpunkt des Dokumentübersetzungsdiensts
✔️: Benutzerdefiniert: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Von Ressource erstellte Region Rechenzentrum für die Anforderungsverarbeitung
Global Nächstgelegenes verfügbares Rechenzentrum.
Amerika USA, Osten 2 • USA, Westen 2
Asien-Pazifik Japan, Osten • Asien, Südosten
Europa (außer der Schweiz) Frankreich, Mitte • Europa, Westen
Schweiz Schweiz, Norden • Schweiz, Westen

Nächste Schritte

In unserer Schnellstartanleitung erfahren Sie, wie Sie schnell mit der Dokumentübersetzung beginnen können. Sie benötigen ein aktives Azure-Konto, damit Sie beginnen können. Wenn Sie noch nicht über eines verfügen, können Sie ein kostenloses Konto erstellen.