次の方法で共有


インテリジェント スピーカーの音声認識を管理する

この記事では、管理者が開催される会議で音声認識とライブ文字起こしを有効にする方法に関するガイダンスを提供します。 管理者は、ユーザーが音声認識とインテリジェント スピーカー機能を利用できるように、organizationの範囲を調整できます。

注意

インテリジェント スピーカーは、すべての国と地域で利用できます。 生体認証登録と会議内文字起こしで現在サポートされているロケールの一覧については、「 サポート されているロケール」を参照してください。

注意

  • Teams Rooms: インテリジェント スピーカーは、Teams Room Pro ライセンスをお持ちのお客様が利用できます。 (レガシ Microsoft Teams Rooms Premium ライセンスの下のデバイスは引き続きサポートされます。
  • BYOD ルーム:ルームホストがMicrosoft Teams PremiumまたはCopilotライセンスを持っている部屋で利用可能なインテリジェントスピーカー。

インテリジェント スピーカーを使用した文字起こし精度の最適化

Microsoft Teams Roomsにインテリジェント スピーカーを使用する場合、会議のトランスクリプトは、部屋内の異なる話者を区別するだけでなく、それらを識別して適切な人物に属性を付けることもできます。 インテリジェントスピーカーは、Copilotとインテリジェントな要約のための重要なユースケースを可能にします。

話者認識は、Teams の認定を受けたインテリジェント なスピーカーによって有効になります。 認定されたインテリジェントスピーカーは、高品質のオーディオを提供し、認識と文字起こしの精度を最大化し、「ワードエラー率」と呼ばれるものの業界をリードする削減を誇るように、複数のマイクで設計されています。

もともとインテリジェントスピーカーには独自のハードウェアが必要でした。それ以来、すべてのTeams Roomsデバイスをサポートするように拡張しました。 より多くの部屋にスピーカー認識の機能を拡張することは喜んでいますが、品質がインテリジェントスピーカー認定デバイスの品質と一致しない可能性があることに注意することが重要です。 そのため、特に最高品質の文字起こしと帰属を達成することが不可欠な重要な空間で、認定されたインテリジェント スピーカーを組み込むことの利点を評価することが不可欠です。

Copilot と会議の要約用に最適化された会議で ID を維持する

Teams での Copilot にとって最も重要な入力は、各話者の ID です。 Copilot では、会議の概要、分析情報、アクション アイテムを提供するために、すべての話者の属性を含む会議のトランスクリプトが必要です。 ハイブリッド会議では、話者認識なしで、会議室のユーザーのビデオとオーディオ フィードは、話している個人ではなく空間 (会議室 1 など) に起因し、個人のコントリビューションのクエリを実行し、すべての人の視点を要約し、それらの To Do 項目に取り組むのが困難になります。

Teams Roomsと BYOD Rooms では、スピーカー認識と呼ばれる高度なテクノロジを使用して、ピッチ、トーン、スピーキング スタイルなど、各スピーカーの個別のボーカル特性を分析し、参加者ごとに音声の指紋に近いボイスプリントを作成します。

話者認識を使用すると、共有ミーティング ルームでのライブ文字起こし中に話者を識別できるため、すべての参加者に明確で正確な音声キャプチャを確保できます。 これにより、インテリジェントな会議の要約と Copilot を使用して、会議中に誰が何を言ったかを簡単に追跡できます。

従業員の話者認識を有効にするには、Teams Desktop アプリを使用して数秒で音声プロファイルを設定できます。 一人一人が一意の音声署名を取得し、Microsoft Cloud のorganizationのテナントに安全に保存され、すべての投稿がすべての会議で正確にキャプチャされ、Copilot とインテリジェントな会議のまとめが可能になり、作業を進めるのに役立ちます。

進行中の会議を示すスクリーンショット。

要件と推奨事項

Teams Rooms:

  • Windows または Android デバイスのTeams RoomsでTeams Rooms。
  • Teams Room Pro ライセンスが割り当てられている会議室リソース アカウント。
  • トランスクリプトの精度を最大限に高めるために、参加者の人数を最大 10 人に制限することをお勧めします。
  • People会議室で識別するには、音声プロファイルを使用して登録し、スケジュールされた会議に招待する必要があります。
  • 音声プロファイルで招待されたユーザーの制限は、現在 20 です。
  • 会議中に高品質のオーディオとビデオをサポートするには、会議室のアップロード速度が 7 Mbps 以上であることをお勧めします。

BYOD ルーム:

  • Windows または macOS 上の Teams デスクトップ クライアント。
  • ルーム ホストには、Teams Premiumまたは Copilot ライセンスが必要です。 ルーム ホストは、ノート PC をインテリジェント スピーカーに接続するユーザーです。
  • トランスクリプトの精度を最大限に高めるために、参加者の人数を最大 10 人に制限することをお勧めします。
  • ユーザーは、会議室で任意のスピーカー マイクを使用でき、USB 経由でノート PC に接続できます。
  • ユーザーは、Teams クライアントが更新されていることを確認する必要があります。
  • 音声プロファイルで招待されたユーザーの現在の制限は、現在 20 です。

注意

  • 識別機能は、会議の開催者のメールボックスがExchange Onlineにある場合にのみサポートされます。 これらは、オンプレミスの Exchange またはサード パーティの予定表 (Google カレンダーなど) ではサポートされていません。
  • ハイブリッド展開は、Teams がクラウド内の開催者の予定表にアクセスできる場合にのみサポートされます。 BYOD シナリオは、識別機能ではサポートされていません。

インテリジェント スピーカー認識を有効にする

エンド ユーザー は、会議スペースで識別できるように、自分の音声プロファイルが登録されている必要があります。 エンド ユーザー登録の有効化に関するガイダンスについては、「 音声と顔の登録 を有効にする」を参照してください。

Teams Roomsデバイスは、エンド ユーザーの生体認証プロファイルを利用して、話しているユーザーを識別するように構成する必要があります。 Teams Roomsが話者を識別できるようにする方法については、「Teams Roomsでユーザー認識を有効にする」を参照してください。

注意

会議出席依頼リストを使用した話者属性は、Microsoft Teams会議室デバイス以外のユーザーが会議に参加したときに開始されます。

BYOD 会議スペースの場合は、その空間内の話者を識別できるようにCsTeamsAIPolicyを構成する必要があります。 特定の有効化ガイダンスについては、「 Set-CsTeamsAIPolicy 」を参照してください。

Set-CsTeamsAiPolicy -Identity Global -SpeakerAttributionBYOD Enabled
ポリシー 説明 値と動作
roomAttributeUserOverride 会議室で音声ベースのユーザー ID を制御します。 この設定は、Rooms アカウントと BYOD ユーザー アカウントに必要です。 オフ
  • Room デバイスは、オーディオ ストリーム節約帯域幅をルームから送信しません。
  • 会議室のユーザーは属性付けも区別もされません。また、音声署名はまったく取得または使用されません。
  • 会議室のユーザーは不明です。

属性
  • ルーム ユーザーは、登録状態に基づいて属性付けされます。
  • 登録されているユーザーは、文字起こしに自分の名前で表示されます。
  • 登録されていないユーザーは、Speaker として表示されます。

区別
  • 会議室のユーザーは、スピーカー 1、スピーカー 2、..として区別され、分離されます。話者の文字起こしを行います。
  • ユーザーの登録状態に関係なく、その名前は文字起こしに表示されません。

注意

ポリシーが割り当てられた後、有効になるまでに最大 48 時間かかることがあります。 ポリシーをより早く有効にするには、アカウントをサインアウトしてサインインし直す必要があります。

注意

Teams 会議ポリシーで文字起こしが有効になっていない場合、識別は行われません。

会議内文字起こしロケール

エンド ユーザーが登録すると、会議中に音声を認識し、会議が次のいずれかの言語に設定されている場合に文字起こしで識別できます。

英語 (米国)、英語 (カナダ)、英語 (インド)、英語 (英国)、英語 (オーストラリア)、英語 (ニュージーランド)、アラビア語 (アラブ首長国連邦)、アラビア語 (サウジアラビア)、中国語 (簡体字中国語)、中国語 (繁体字、 Hong Kong SAR)、中国語 (繁体字、台湾)、チェコ語 (チェコ語)、デンマーク語 (デンマーク)、オランダ語 (ベルギー)、オランダ語 (オランダ語)、フランス語 (カナダ)、フランス語 (フランス)、フィンランド語 (フィンランド)、ドイツ語 (ドイツ)、ギリシャ語 (ギリシャ)、ヘブライ語 (イスラエル)、ヒンディー語 (インド)、ハンガリー語 (ハンガリー)、イタリア語 (イタリア)、 日本語 (日本)、韓国語 (韓国)、ノルウェー語 (ノルウェー)、ポーランド語 (ポーランド)、ポルトガル語 (ブラジル)、ルーマニア語 (ルーマニア)、ロシア語 (ロシア)、スロバキア語 (スロバキア)、スペイン語 (メキシコ)、スペイン語 (スペイン)、スウェーデン語 (スウェーデン)、タイ語 (タイ)、トルコ語 (Türkiye)、ウクライナ語 (ウクライナ)、ベトナム語 (ベトナム)、ウェールズ語 (英国)

よく寄せられる質問 (FAQ)

音声プロファイルのデータの使用状況とストレージに関するその他の質問がある場合は、 顔と音声の登録 ドキュメントを確認してください

サポート記事: インテリジェント スピーカーを使用して室内の参加者を特定する