Freigeben über


Schnellstart: Erstellen, Veröffentlichen und Übersetzen mit benutzerdefiniertem Übersetzer

Translator ist ein cloudbasierter neuraler maschineller Übersetzungsdienst, der Teil der Foundry Tools-Familie der REST-API ist, die mit jedem Betriebssystem verwendet werden kann. Der Übersetzer unterstützt viele Microsoft-Produkte und -Dienste, die von Tausenden von Unternehmen weltweit verwendet werden, um Sprachübersetzungen und andere sprachbezogene Vorgänge durchzuführen. In diesem Schnellstart erfahren Sie, wie Sie benutzerdefinierte Lösungen für Ihre Anwendungen in allen unterstützten Sprachen erstellen.

Voraussetzungen

Um das Portal für benutzerdefinierte Übersetzer zu verwenden, benötigen Sie die folgenden Ressourcen:

  • Ein Microsoft-Konto

  • Azure-Abonnement – Erstellen eines kostenlosen Kontos

  • Sobald Sie über ein Azure-Abonnement verfügen, erstellen Sie eine Textübersetzungsressource im Azure-Portal, um Ihren Schlüssel und Endpunkt zu erhalten. Wählen Sie nach Abschluss der Bereitstellung Zu Ressource wechseln aus.

    • Sie benötigen den Schlüssel und endpunkt aus der Ressource, um Ihre Anwendung mit dem Übersetzer zu verbinden. Fügen Sie den Schlüssel und den Endpunkt später im Schnellstart in den Code ein. Diese Werte sind im Azure-Portal auf der Seite Schlüssel und Endpunkt aufgeführt:

      Screenshot: Seite mit Schlüsseln und Endpunkt im Azure-Portal.

Weitere Informationen finden Sie unterErstellen einer Übersetzerressource.

Portal für den benutzerdefinierten Translator

Melden Sie sich nach Abschluss der Voraussetzungen beim Portal für benutzerdefinierte Übersetzer an, um Arbeitsbereiche zu erstellen, Projekte zu erstellen, Dateien hochzuladen, Modelle zu trainieren und Ihre benutzerdefinierte Lösung zu veröffentlichen.

Sie können eine Übersicht über die Übersetzung und die benutzerdefinierte Übersetzung lesen, Tipps erhalten und sich im technischen Blog zu Azure KI ein Video zu den ersten Schritten ansehen.

Prozessübersicht

  1. Erstellen Sie einen Arbeitsbereich. Ein Arbeitsbereich ist ein Bereich zum Erstellen und Entwickeln Ihres benutzerdefinierten Übersetzungssystems. Er kann mehrere Projekte, Modelle und Dokumente enthalten. Alle Aufgaben, die Sie in benutzerdefiniertem Übersetzer ausführen, werden in einem bestimmten Arbeitsbereich ausgeführt.

  2. Erstellen Sie ein Projekt. Ein Projekt ist ein Wrapper für Modelle, Dokumente und Tests. Jedes Projekt enthält alle Dokumente, die mit dem korrekten Sprachenpaar in den Arbeitsbereich hochgeladen werden. Wenn Sie beispielsweise sowohl ein Projekt für die Sprachrichtung Englisch–Spanisch als auch ein Projekt für die Sprachrichtung Spanisch–Englisch haben, sind die gleichen Dokumente in beiden Projekten enthalten.

  3. Laden Sie parallele Dokumente hoch. Parallele Dokumente sind Dokumentpaare, bei denen ein Dokument (Ziel) die Übersetzung des anderen (Quelle) enthält. Ein Dokument des Paars enthält Sätze in der Ausgangssprache, und das andere enthält Sätze, die in die Zielsprache übersetzt wurden. Es spielt keine Rolle, welche Sprache als „Quelle“ und welche als „Ziel“ markiert ist. Mit einem parallelen Dokument kann ein Übersetzungssystem in beide Richtungen trainiert werden.

  4. Trainieren Sie Ihr Modell. Ein Modell ist das System, das Übersetzungen für ein bestimmtes Sprachenpaar bereitstellt. Das Ergebnis eines erfolgreichen Trainings ist ein Modell. Beim Trainieren eines Modells sind drei sich gegenseitig ausschließende Dokumenttypen erforderlich: Training, Optimierung und Testen. Wenn beim Queuing eines Trainings nur ein Trainingsdataset angegeben wird, erstellt Benutzerdefinierter Translator automatisch Optimierungs- und Testdaten. Er verwendet eine zufällige Teilmenge von Sätzen aus den Trainingsdokumenten und schließt diese Sätze aus den eigentlichen Trainingsdaten aus. Sie müssen mindestens über 10.000 parallele Sätze verfügen, um ein Modell zu trainieren.

  5. Testen Sie Ihr Modell (Auswertung durch Menschen). Der Testsatz wird verwendet, um die BLEU-Bewertung zu berechnen. Dieser Wert gibt die Qualität Ihres Übersetzungssystems an.

  6. Veröffentlichen Sie Ihr trainiertes Modell (stellen Sie es bereit). Ihr benutzerdefiniertes Modell wird für Runtime-Übersetzungsanfragen verfügbar gemacht.

  7. Übersetzen Sie Text. Verwenden Sie die cloudbasierte, sichere, leistungsstarke, hoch skalierbare Microsoft Translator Text-API v3 , um Übersetzungsanforderungen zu stellen.

Erstellen eines Arbeitsbereichs

  1. Nachdem Sie sich bei dem benutzerdefinierten Übersetzer angemeldet haben, werden Sie um Erlaubnis gebeten, Ihr Profil von der Microsoft Identity-Plattform zu lesen, um Ihr Benutzerzugriffstoken und Ihr Aktualisierungstoken anzufordern. Beide Token werden zur Authentifizierung benötigt. Außerdem gewährleisten sie, dass Sie während Ihrer Echtzeitsitzung oder während des Trainings Ihrer Modelle nicht abgemeldet werden.
    Wählen Sie Ja aus.

    Screenshot: Erstellung eines Arbeitsbereichs.

  2. Wählen Sie Meine Arbeitsbereiche aus.

  3. Klicken Sie auf Create a new workspace (Neuen Arbeitsbereich erstellen).

  4. Geben Sie Contoso MT models (Contoso-MT-Modelle) als Arbeitsbereichsname ein, und wählen Sie Weiter aus.

  5. Wählen Sie für Select resource region (Ressourcenregion auswählen) „Global“ aus der Dropdownliste aus.

  6. Kopieren Sie den Schlüssel des Übersetzer-Diensts, und fügen Sie ihn ein.

  7. Wählen Sie Weiter aus.

  8. Wählen Sie Fertigaus.

    Hinweis

    Die Region muss mit der Region übereinstimmen, die während der Ressourcenerstellung ausgewählt wurde. Sie können SCHLÜSSEL 1 oder SCHLÜSSEL 2 verwenden.

    Screenshot zur Veranschaulichung des Ressourcenschlüssels.

    Screenshot zur Veranschaulichung der Arbeitsbereicherstellung.

Erstellen eines Projekts

Nachdem der Arbeitsbereich erfolgreich erstellt wurde, wird die Seite Projekte angezeigt.

Sie erstellen ein Projekt mit der Sprachrichtung Englisch-Deutsch, um ein benutzerdefiniertes Modell nur mit dem Dokumenttyp Training zu trainieren.

  1. Wählen Sie Projekt erstellen aus.

  2. Geben Sie English-to-German (Englisch-Deutsch) unter Projektname ein.

  3. Wählen Sie English (en) (Englisch [EN]) in der Dropdownliste als Ausgangssprache aus.

  4. Wählen Sie German (de) (Deutsch [DE]) in der Dropdownliste als Zielsprache aus.

  5. Wählen Sie Allgemein in der Dropdownliste für Domäne aus.

  6. Wählen Sie Projekt erstellen aus.

    Screenshot: Erstellen eines Projekts.

Hochladen von Dokumenten

Um ein benutzerdefiniertes Modell zu erstellen, müssen Sie eine Kombination aus Trainings-, Optimierungs-, Test- und Wörterbuch-Dokumentarten hochladen.

In diesem Schnellstart zeigen wir Ihnen, wie Trainingsdokumente zur Anpassung hochgeladen werden.

Hinweis

Für diesen Schnellstart können Sie unser Beispieldataset für Trainings-, Ausdrucks- und Satzwörterbücher (Kundenbeispieldatensätze mit der Sprachrichtung Englisch-Deutsch) verwenden. Für die Produktion ist es jedoch besser, Ihr eigenes Trainings-Dataset hochzuladen.

  1. Wählen Sie den Projektnamen English-to-German aus.

  2. Wählen Sie im linken Bereich "Dokumente verwalten" aus.

  3. Wählen Sie Add document set (Dokumentsatz hinzufügen) aus.

  4. Aktivieren Sie das Kontrollkästchen Training set (Trainingssatz), und wählen Sie Weiter aus.

  5. Lassen Sie Parallel documents (Parallele Dokumente) aktiviert, und geben Sie sample-English-German (Beispiel Englisch-Deutsch) ein.

  6. Wählen Sie unter Source (English - EN) file (Quelldatei [Englisch – EN]) Dateien durchsuchen aus, und wählen Sie sample-English-German-Training-en.txt aus.

  7. Wählen Sie unter Target (German - EN) file (Zieldatei [Deutsch – DE]) Dateien durchsuchen aus, und wählen Sie sample-English-German-Training-de.txt aus.

  8. Wählen Sie Hochladen aus

    Hinweis

    Sie können das Dataset mit Beispielausdrücken und Satzwörterbüchern hochladen. Diesen Schritt müssen Sie noch ausführen.

    Screenshot: Hochladen von Dokumenten.

Trainieren Ihres Modells

Nun können Sie das Modell mit der Sprachrichtung Englisch-Deutsch trainieren.

  1. Wählen Sie im linken Bereich " Modell trainieren " aus.

  2. Geben Sie en-de with sample data (EN-DE mit Beispieldaten) für Modellname ein.

  3. Lassen Sie Full training (Vollständiges Training) aktiviert.

  4. Aktivieren Sie unter Dokumente auswählensample-English-German, und überprüfen Sie die Kosten des Trainings für die ausgewählte Anzahl an Sätzen.

  5. Wählen Sie Jetzt trainieren aus.

  6. Wählen Sie Trainieren aus, um dies zu bestätigen.

    Hinweis

    Benachrichtigungen zeigen modellbegleitende Schulungen an, z. B. "Datenstatus übermitteln ". Das Trainieren des Modells dauert einige Stunden, abhängig von der Anzahl der ausgewählten Sätze.

    Screenshot: Erstellen eines Modells.

  7. Wählen Sie nach erfolgreicher Modellschulung modelldetails im linken Bereich aus.

  8. Wählen Sie den Modellnamen en-de mit Beispieldaten aus. Überprüfen Sie Datum und Uhrzeit des Trainings, die Gesamttrainingszeit und die Anzahl der Sätze, die für Training, Optimierung, Tests und Wörterbuch verwendet wurden. Überprüfen Sie, ob das System die Test- und Optimierungssätze generiert hat. Sie verwenden die Kategorie-ID (Category ID), um Übersetzungsanforderungen zu stellen.

  9. Auswerten der BLEU-Bewertung des Modells. Der Testsatz ist die BLEU-Bewertung die Bewertung des benutzerdefinierten Modells und die Baseline-BLEU das vorab trainierte Baselinemodell, das für die Anpassung verwendet wurde. Eine höhere BLEU-Bewertung bedeutet eine höhere Übersetzungsqualität bei Verwendung des benutzerdefinierten Modells.

    Hinweis

    Wenn Sie mit unseren freigegebenen Kundenbeispiel-Datasets trainieren, kann die BLEU-Bewertung vom Bild abweichen.

    Screenshot: Modelldetails.

Testen des Modells

Nachdem das Training erfolgreich abgeschlossen wurde, überprüfen Sie die übersetzten Sätze aus dem Testsatz.

  1. Wählen Sie im linken Bereich " Testmodell " aus.
  2. Wählen Sie „en-de with sample data“ aus.
  3. Unterziehen Sie die Übersetzung aus Neues Modell (dem benutzerdefinierten Modell) und Baselinemodell (unserer vorab trainierten Baseline für die Anpassung) einer Überprüfung durch Menschen, wobei mit Referenz (der Zielübersetzung aus dem Testsatz) verglichen wird

Veröffentlichen Ihres Modells

Wenn Sie Ihr Modell veröffentlichen, steht es für die Verwendung mit der Übersetzer-API zur Verfügung. Ein Projekt kann über ein oder mehrere erfolgreich trainierte Modelle verfügen. Sie können nur ein Modell pro Projekt veröffentlichen, ein Modell jedoch je nach Ihren Anforderungen in einer oder mehreren Regionen veröffentlichen. Weitere Informationen finden Sie unter Übersetzer – Preise.

  1. Wählen Sie im linken Bereich das Veröffentlichungsmodell aus.

  2. Wählen Sie en-de with sample data und dann Veröffentlichen aus.

  3. Aktivieren Sie die gewünschten Regionen.

  4. Wählen Sie Veröffentlichen. Der Status sollte von Bereitstellen in Bereitgestellt übergehen.

    Screenshot: Bereitstellen eines trainierten Modells.

Text übersetzen

  1. Entwickler sollten Category ID verwenden, wenn sie Übersetzungsanforderungen mit der Microsoft Translator Text API v3 stellen. Weitere Informationen zur Textübersetzungs-API finden Sie auf der Webseite mit der API-Referenz.

  2. Geschäftsbenutzer können unsere kostenlose DocumentTranslator-App für Windows herunterladen und installieren.

Nächste Schritte