Custom Speech を使用すると、リアルタイムの音声テキスト変換、音声翻訳、バッチ文字起こし用のカスタム モデルを使用して、アプリケーションの音声認識の精度を向上させることができます。
ヒント
Speech Studio から Microsoft Foundry ポータルにカスタム音声モデルを取り込みます。 Microsoft Foundry ポータルでは、既存の Speech リソースに接続することで、中断した場所を選択できます。 既存の Speech リソースへの接続の詳細については、既存の Speech リソースへの接続に関する記事を参照してください。
Foundry Tools の Azure Speech ベース モデルを独自のデータで微調整することで、カスタム音声モデルを作成します。 データのアップロード、カスタム モデルのテストとトレーニング、モデル間の正確性の比較、カスタム エンドポイントへのモデルのデプロイを行うことができます。
この記事では、微調整を使用してカスタム音声モデルを作成する方法について説明します。 Custom Speech の詳細については、Custom Speech の概要に関するドキュメントを参照してください。
ヒント
カスタム音声モデルは、 Speech Studio から Microsoft Foundry ポータルに移動できます。 Microsoft Foundry では、既存の Speech リソースに接続することで、中断した場所を選択できます。 既存の Speech リソースへの接続の詳細については、既存の Speech リソースへの接続に関する記事を参照してください。
微調整を開始する
カスタム音声の微調整には、モデル、トレーニングとテストのデータセット、デプロイ エンドポイントが含まれます。 各プロジェクトはロケール別になっています。 たとえば、米国では英語を微調整できます。
Microsoft Foundry ポータルでは、一部の Foundry Tools モデルを微調整できます。 たとえば、Custom Speech のモデルを微調整できます。 各カスタム モデルは、ロケールに固有です。 たとえば、米国の英語のモデルを微調整できます。
Microsoft Foundry ポータルでプロジェクトに移動します。 プロジェクトを作成する必要がある場合は、「 Microsoft Foundry プロジェクトの作成」を参照してください。
左側のペインから [微調整] を選択します。
[AI サービスの微調整]>[+ 微調整] を選択します。
ウィザードで、音声カスタマイズ(音声認識の微調整)を選択します。 [次へ] を選択します。
微調整のタスクの言語、名前、説明を入力します。 [作成] を選択します。
微調整を続行する
カスタム音声モデルの微調整を続行する方法については、Azure Speech のドキュメントを参照してください。
微調整されたモデルを表示する
微調整が完了したら、[ 微調整 ] ページからカスタム音声モデルとデプロイにアクセスできます。
Microsoft Foundry ポータルにサインインします。
左側のペインから [微調整] を選択します。
[AI サービスの微調整] を選択します。
カスタム音声プロジェクトを作成した後は、[カスタム 音声] ページ からカスタム音声モデルとデプロイにアクセスできます。
Speech Studio にサインインします。
使用するサブスクリプションと Speech リソースを選択します。
重要
オーディオ データを使用してカスタム モデルをトレーニングする場合は、オーディオ データをトレーニングするための専用ハードウェアがあるリージョンのサービス リソースを選択します。 詳細については、リージョン テーブルの脚注を参照してください。
[Custom Speech]>[新しいプロジェクトを作成する] を選択します。
ウィザードの手順に従ってプロジェクトを作成します。
新しいプロジェクトの名前を選択するか、[プロジェクトに移動] を選択します。 その後、左側のパネルに、 音声データセット、 カスタム モデルのトレーニング、 モデルのテスト、モデル のデプロイというメニュー項目が表示されます。
REST API のプロジェクト ID を取得する
カスタム音声用の音声テキスト変換 REST API を使用する場合は、 project プロパティをカスタム音声プロジェクトの ID に設定する必要があります。
projectで微調整を管理できるように、 プロパティを設定する必要があります。
重要
カスタム音声のプロジェクト ID は、Microsoft Foundry プロジェクトの ID と同じではありません。
カスタム音声モデルの微調整を選択または開始すると、URL にプロジェクト ID が表示されます。
Microsoft Foundry ポータルにサインインします。
左側のペインから [微調整] を選択します。
[AI サービスの微調整] を選択します。
[ モデル名 ] 列から、確認するカスタム モデルを選択します。
ブラウザーで URL を調べます。 プロジェクト ID は URL の一部です。 たとえば、プロジェクト ID は次の URL に
00001111-aaaa-2222-bbbb-3333cccc4444。https://ai.azure.com/build/models/aiservices/speech/customspeech/00001111-aaaa-2222-bbbb-3333cccc4444/<REDACTED_FOR_BREVITY>
カスタム音声用の音声テキスト変換 REST API を使用する場合は、 project プロパティをカスタム音声プロジェクトの ID に設定する必要があります。
project で微調整を管理できるように、 プロパティを設定する必要があります。
Speech Studio でカスタム音声プロジェクトのプロジェクト ID を取得するには:
Speech Studio にサインインし、[Custom speech] タイルを選択します。
カスタム音声プロジェクトを選択します。
ブラウザーで URL を調べます。 プロジェクト ID は URL の一部です。 たとえば、プロジェクト ID は次の URL に
00001111-aaaa-2222-bbbb-3333cccc4444。https://speech.microsoft.com/portal/<Your-Resource-ID>/customspeech/a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1