Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Mit Custom Speech können Sie die Genauigkeit der Spracherkennung für Ihre Anwendungen verbessern, indem Sie ein benutzerdefiniertes Modell für Echtzeit-Spracherkennung zu Text, Sprachübersetzung und Batchtranskription verwenden.
Tipp
Bringen Sie Ihre benutzerdefinierten Sprachmodelle aus Speech Studio in das Microsoft Foundry-Portal. Im Microsoft Foundry-Portal können Sie an der Stelle weiterholen, an der Sie aufgehört haben, indem Sie eine Verbindung mit Ihrer vorhandenen Sprachressource herstellen. Weitere Informationen zum Herstellen einer Verbindung mit einer vorhandenen Sprachressource finden Sie unter Herstellen einer Verbindung mit einer vorhandenen Sprachressource.
Sie erstellen ein benutzerdefiniertes Sprachmodell, indem Sie ein Azure Speech in Foundry Tools-Basismodell mit Ihren eigenen Daten optimieren. Sie können eigene Daten hochladen, ein benutzerdefiniertes Modell testen und trainieren, die Genauigkeit zwischen Modellen vergleichen und ein Modell auf einem benutzerdefinierten Endpunkt bereitstellen.
In diesem Artikel erfahren Sie, wie Sie ein benutzerdefiniertes Sprachmodell mithilfe von Feintuning erstellen. Weitere Informationen zu Custom Speech finden Sie in der Dokumentation Übersicht zu Custom Speech.
Tipp
Sie können Ihre benutzerdefinierten Sprachmodelle von Speech Studio in das Microsoft Foundry-Portal übertragen. In Microsoft Foundry können Sie an der Stelle weiterholen, an der Sie aufgehört haben, indem Sie eine Verbindung mit Ihrer vorhandenen Sprachressource herstellen. Weitere Informationen zum Herstellen einer Verbindung mit einer vorhandenen Sprachressource finden Sie unter Herstellen einer Verbindung mit einer vorhandenen Sprachressource.
Starten der Feinabstimmung
Die Feinabstimmung der benutzerdefinierten Spracherkennungsmodelle umfasst Modelle, Schulungs- und Testdatensätze sowie Bereitstellungsendpunkte. Jedes Projekt ist für ein Gebietsschema spezifisch. Sie können z. B. ein Modell für Englisch in den USA optimieren.
Im Microsoft Foundry-Portal können Sie einige Foundry Tools-Modelle optimieren. Sie können z. B. ein Modell für Custom Speech optimieren. Jedes benutzerdefinierte Modell ist spezifisch für eine Region. Sie können z. B. ein Modell für Englisch in den USA optimieren.
Wechseln Sie zum Projekt im Microsoft Foundry-Portal. Wenn Sie ein Projekt erstellen müssen, lesen Sie " Erstellen eines Microsoft Foundry"-Projekts.
Wählen Sie im linken Bereich Feinabstimmung aus.
Wählen Sie Feinabstimmung des KI-Dienstes>+ Feinabstimmen aus.
Wählen Sie im Assistenten Benutzerdefinierte Sprache (Spracherkennung und Feinabstimmung von Sprache zu Text) für benutzerdefinierte Spracherkennung aus. Wählen Sie dann Weiter aus.
Geben Sie die Sprache, den Namen und die Beschreibung für den Feinabstimmungsauftrag ein. Wählen Sie dann Erstellen aus.
Weiter optimieren
Wechseln Sie zur Azure-Sprachdokumentation, um zu erfahren, wie Sie Ihr benutzerdefiniertes Sprachmodell weiter optimieren:
- Hochladen von Schulungs- und Testdatensätzen
- Trainieren eines Modells
- Testmodell quantitativ und testmodell qualitativ
- Bereitstellen eines Modells
Anzeigen optimierter Modelle
Nach der Feinabstimmung können Sie auf Ihre benutzerdefinierten Sprachmodelle und Bereitstellungen über die Feinabstimmungsseite zugreifen.
Melden Sie sich beim Microsoft Foundry-Portal an.
Wählen Sie im linken Bereich Feinabstimmung aus.
Wählen Sie Feinabstimmung des KI-Dienstes aus.
Nachdem Sie ein benutzerdefiniertes Sprachprojekt erstellt haben, können Sie auf Ihre benutzerdefinierten Sprachmodelle und Bereitstellungen über die Seite "Benutzerdefinierte Spracherkennung " zugreifen.
Melden Sie sich in Speech Studio an.
Wählen Sie das Abonnement und die Speech-Ressource aus, mit denen Sie arbeiten möchten.
Wichtig
Wenn Sie ein benutzerdefiniertes Modell mit Audiodaten trainieren, wählen Sie eine Dienstressource in einer Region mit dedizierter Hardware für Schulungsaudiodaten aus. Weitere Informationen finden Sie in den Fußnoten der Tabelle Regionen.
Klicken Sie auf Custom Speech>Neues Projekt erstellen.
Folgen Sie den Anweisungen des Assistenten, um Ihr Projekt zu erstellen.
Wählen Sie das neue Projekt nach Name aus, oder klicken Sie auf Zum Projekt wechseln. Dann sollten diese Menüelemente im linken Bereich angezeigt werden: Sprachdatensätze, Train custom models, Test models, and Deploy models.
Abrufen der Projekt-ID für die REST-API
Wenn Sie die Spracherkennungs-REST-API für benutzerdefinierte Sprache verwenden, müssen Sie die Eigenschaft project auf die ID Ihres benutzerdefinierten Sprachprojekts festlegen. Sie müssen die project Eigenschaft so festlegen, dass Sie die Feinabstimmung im Microsoft Foundry-Portal verwalten können.
Wichtig
Die Projekt-ID für benutzerdefinierte Spracherkennung entspricht nicht der ID des Microsoft Foundry-Projekts.
Sie finden die Projekt-ID in der URL, nachdem Sie ein benutzerdefiniertes Sprachmodell ausgewählt oder abgestimmt haben.
Melden Sie sich beim Microsoft Foundry-Portal an.
Wählen Sie im linken Bereich Feinabstimmung aus.
Wählen Sie Feinabstimmung des KI-Dienstes aus.
Wählen Sie das benutzerdefinierte Modell, das Sie überprüfen möchten, aus der Spalte "Modellname" aus.
Überprüfen Sie die URL in Ihrem Browser. Die Projekt-ID ist Teil der URL. Die Projekt-ID befindet
00001111-aaaa-2222-bbbb-3333cccc4444sich beispielsweise in der folgenden URL:https://ai.azure.com/build/models/aiservices/speech/customspeech/00001111-aaaa-2222-bbbb-3333cccc4444/<REDACTED_FOR_BREVITY>
Wenn Sie die Spracherkennungs-REST-API für benutzerdefinierte Sprache verwenden, müssen Sie die Eigenschaft project auf die ID Ihres benutzerdefinierten Sprachprojekts festlegen. Sie müssen die project Eigenschaft so konfigurieren, dass Sie die Feinabstimmung im Speech Studio verwalten können.
So rufen Sie die Projekt-ID für ein benutzerdefiniertes Sprachprojekt in Speech Studio ab:
Melden Sie sich beim Speech Studio an, und wählen Sie die Kachel "Benutzerdefinierte Spracherkennung " aus.
Wählen Sie Ihr benutzerdefiniertes Sprachprojekt aus.
Überprüfen Sie die URL in Ihrem Browser. Die Projekt-ID ist Teil der URL. Die Projekt-ID befindet
00001111-aaaa-2222-bbbb-3333cccc4444sich beispielsweise in der folgenden URL:https://speech.microsoft.com/portal/<Your-Resource-ID>/customspeech/a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1