介绍

已完成

语音是人类沟通的最自然的方式之一,将语音功能引入 AI 应用程序可创建更直观、更易访问且更具吸引力的用户体验。 无论是构建语音助理、创建可访问的应用程序还是开发对话式 AI 代理,了解语音技术对于现代 AI 解决方案至关重要。

在本模块中,你将了解支持语音的应用程序的两种基本语音功能: 语音识别 (将口语转换为文本)和 语音合成 (将文本转换为自然语音)。 你将了解这些技术如何协同工作,以创建无缝的语音交互,并了解语音可以转换用户体验的实际方案。

注释

我们认识到不同的人喜欢以不同的方式学习。 可以选择以基于视频的格式完成此模块,也可以以文本和图像的形式读取内容。 文本包含比视频更详细的内容,因此在某些情况下,你可能希望将其称为视频演示文稿的补充材料。