Compartir a través de


Administrar el reconocimiento de voz para el altavoz inteligente

Este artículo proporciona instrucciones sobre cómo los administradores pueden habilitar el reconocimiento de voz y la transcripción en directo para las reuniones que se realizan. Como administrador, tiene la capacidad de ajustar hasta qué punto su organización permite a los usuarios usar el reconocimiento de voz y las capacidades de los altavoces inteligentes.

Nota

El altavoz inteligente está disponible en todos los países y regiones. Consulte Configuraciones regionales admitidas para obtener una lista de las configuraciones regionales compatibles actualmente con la inscripción biométrica y la transcripción en la reunión.

Nota

  • Salas de Teams: Los altavoces inteligentes están disponibles para los clientes con licencias de Teams Room Pro. (Se siguen admitiendo determinados dispositivos en licencias de Salas de Microsoft Teams Premium heredadas).
  • Habitaciones BYOD: Altavoces inteligentes disponibles en salas donde el anfitrión de la sala tiene una licencia de Microsoft Teams Premium o Copilot.

Optimización de la precisión de la transcripción con altavoces inteligentes

Al usar Altavoz inteligente para Salas de Microsoft Teams, la transcripción de la reunión no solo puede distinguir entre diferentes oradores de la sala, sino también identificarlos y atribuirlos a la persona correcta. El altavoz inteligente permite casos de uso críticos para Copilot y un resumen inteligente.

El reconocimiento de altavoces está habilitado por altavoces inteligentes certificados para Teams. Los altavoces inteligentes certificados están diseñados con varios micrófonos para proporcionar audio de alta calidad, maximizar la precisión en el reconocimiento y la transcripción, y cuentan con una reducción líder en la industria de lo que se conoce como "tasa de error de palabras".

Originalmente, el altavoz inteligente requería hardware único, que hemos ampliado desde entonces para admitir todos los dispositivos Salas de Teams. Aunque estamos encantados de ampliar la capacidad de reconocimiento de altavoces a más salas, es importante tener en cuenta que la calidad puede no coincidir con la de un dispositivo con certificación de altavoz inteligente. Por lo tanto, es esencial evaluar las ventajas de incorporar un orador inteligente certificado, especialmente en espacios cruciales donde lograr la transcripción y atribución de la más alta calidad es vital.

Mantener su identidad en reuniones optimizadas para Copilot y resumen de reuniones

La entrada más esencial para Copilot en Teams es la identidad de cada orador. Copiloto necesita una transcripción de la reunión, con atribución para cada orador, para ofrecer resúmenes de la reunión, perspectivas y elementos de acción. En una reunión híbrida, sin el reconocimiento de oradores, el vídeo y la fuente de audio de las personas de la sala se atribuirían al espacio (por ejemplo, sala de conferencias 1), no a las personas que hablan, lo que dificultaba consultar las contribuciones de los usuarios, resumir las perspectivas de todos y abordar esas tareas pendientes.

Salas de Teams y byod rooms utilizan tecnología avanzada llamada reconocimiento de altavoces para analizar las características vocales diferentes de cada orador, como el tono, el tono y el estilo hablador, para crear una huella vocal para cada participante, similar a una huella digital para su voz.

Con el reconocimiento de altavoces, los altavoces se pueden identificar durante la transcripción en directo en salas de reuniones compartidas, lo que garantiza una captura de voz clara y precisa para cada participante. Esto le permite realizar un seguimiento sin esfuerzo de quién dijo qué durante la reunión a través de un resumen inteligente de la reunión y Copilot.

Para habilitar el reconocimiento de altavoces para los empleados, puede configurar un perfil de voz en cuestión de segundos con la aplicación de escritorio de Teams. Cada persona obtiene una firma de voz única, almacenada de forma segura en el espacio empresarial de su organización en Microsoft Cloud para garantizar que todas las contribuciones se capturan con precisión en cada reunión, lo que habilita copiloto y resumen inteligente de reuniones, y le ayuda a impulsar su trabajo hacia adelante.

Captura de pantalla que muestra una reunión en curso.

Requisitos y recomendaciones

Salas de Teams:

  • Salas de Teams en Windows o Salas de Teams en dispositivos Android.
  • Cuenta de recursos de sala con una licencia de Teams Room Pro asignada.
  • Para garantizar la mejor precisión para la transcripción, le sugerimos limitar el número de asistentes en persona a un máximo de 10 personas.
  • Personas identificarse en la sala, debe inscribirse con su perfil de voz e invitarlo a la reunión programada.
  • La limitación para las personas invitadas con perfil de voz es actualmente 20.
  • Para admitir audio y vídeo de alta calidad durante las reuniones, recomendamos que la sala de reuniones tenga una velocidad de carga de al menos 7 Mbps.

Habitaciones BYOD:

  • Cliente de escritorio de Teams en Windows o macOS.
  • Los hosts de salas deben tener Teams Premium o una licencia de Copilot. El anfitrión de la sala es la persona que conecta su portátil al altavoz inteligente.
  • Para garantizar la mejor precisión para la transcripción, le sugerimos limitar el número de asistentes en persona a un máximo de 10 personas.
  • Los usuarios pueden usar cualquier micrófono de altavoz en una sala y pueden conectarlo a través de USB a sus portátiles.
  • Los usuarios deben asegurarse de que su cliente de Teams está actualizado.
  • La limitación actual para las personas invitadas con perfil de voz es actualmente 20.

Nota

  • Las características de identificación solo se admiten cuando el buzón del organizador de la reunión está en Exchange Online. No son compatibles con los calendarios locales de Exchange o de terceros (por ejemplo, Google Calendar).
  • Las implementaciones híbridas solo son compatibles si Teams puede acceder al calendario del organizador en la nube. Los escenarios BYOD no son compatibles con las características de identificación.

Habilitar el reconocimiento de altavoces inteligente

Los usuarios finales deben tener inscrito su perfil de voz para poder identificarse en un espacio de reunión. Vea Habilitar la inscripción por voz y reconocimiento facial para obtener instrucciones sobre cómo habilitar la inscripción del usuario final.

Salas de Teams dispositivos deben configurarse para utilizar un perfil biométrico de los usuarios finales para identificar quién está hablando. Vea Habilitar el reconocimiento de personas en Salas de Teams para obtener instrucciones sobre cómo habilitar Salas de Teams para identificar los altavoces.

Nota

La atribución del orador mediante la lista de invitaciones a la reunión comienza cuando alguien que no sea un dispositivo de la sala de Microsoft Teams se une a la reunión.

Para un espacio de reunión BYOD, debe configurarse para permitir la CsTeamsAIPolicy identificación de los altavoces dentro de ese espacio. Consulte Set-CsTeamsAIPolicy para obtener instrucciones de habilitación específicas.

Set-CsTeamsAiPolicy -Identity Global -SpeakerAttributionBYOD Enabled
Directiva Descripción Valores y comportamiento
roomAttributeUserOverride Controle la identificación de usuario basada en voz en las salas de reuniones. Esta configuración es necesaria para las cuentas de salas y cuentas de usuario BYOD. Desactivado
  • El dispositivo de sala no enviará ancho de banda para guardar secuencias de audio desde la sala.
  • Los usuarios de las salas de reuniones no se atribuirán ni distinguirán, y sus firmas de voz no se recuperarán ni se usarán en absoluto.
  • Se desconocen los usuarios de las salas de reuniones.

Atributo
  • Los usuarios de salas se atribuirán en función de su estado de inscripción.
  • Los usuarios inscritos se muestran con su nombre en la transcripción.
  • Los usuarios que no están inscritos se muestran como oradores.

Distinguir
  • Los usuarios de las salas se distinguirán y separarán como altavoz 1, altavoz 2, .... orador en la transcripción.
  • Independientemente del estado de inscripción del usuario, su nombre no se mostrará en la transcripción.

Nota

Después de asignar una directiva, pueden pasar hasta 48 horas en aplicarse. Para que la directiva surta efecto antes, es necesario cerrar la sesión de las cuentas y volver a iniciarla.

Nota

Si la transcripción no está habilitada en la directiva de reunión de Teams, no se identificará.

Configuraciones regionales de transcripción durante la reunión

Una vez que un usuario final se inscribe, su voz se puede reconocer durante las reuniones e identificarse en la transcripción cuando la reunión se establece en uno de los siguientes idiomas:

Inglés (Estados Unidos), inglés (Canadá), inglés (India), inglés (Reino Unido), inglés (Australia), inglés (Nueva Zelanda), árabe (Emiratos Árabes), árabe (Arabia Saudí), chino (China simplificada), chino (tradicional, Hong Kong RAE), chino (tradicional, Taiwán), checo (Checo), danés (Dinamarca), neerlandés (Bélgica), neerlandés (Países Bajos), francés (Canadá), francés (Francia), finlandés (Finlandia), alemán (Alemania), griego (Grecia), hebreo (Israel), hindi (India), húngaro (Hungría), italiano (Italia), Japonés (Japón), coreano (Corea), noruego (Noruega), polaco (Polonia), portugués (Brasil), portugués (Portugal), rumano (Rumania), ruso (Rusia), eslovaco (Eslovaquia), español (México), español (España), sueco (Suecia), tailandés (Tailandia), turco (Türkiye), ucraniano (Ucrania), vietnamita (Vietnam), galés (Reino Unido)

Preguntas más frecuentes (P+F)

Revisa el documento de reconocimiento facial y de inscripción de voz si tienes más preguntas sobre el uso y el almacenamiento de datos del perfil de voz.

Artículo de soporte técnico: Usar altavoces inteligentes para identificar a los participantes en la sala