Einleitung
Die Spracherkennung ist eine der natürlichsten Kommunikationsmöglichkeiten des Menschen und das Bereitstellen von Sprachfunktionen für KI-Anwendungen schafft intuitivere, barrierefreiere und ansprechendere Benutzeroberflächen. Ganz gleich, ob Sie einen Sprachassistenten erstellen, barrierefreie Anwendungen erstellen oder Unterhaltungs-KI-Agents entwickeln, das Verständnis von Sprachtechnologien ist für moderne KI-Lösungen unerlässlich.
In diesem Modul werden Sie die beiden grundlegenden Sprachfunktionen erkunden, die sprachfähige Anwendungen unterstützen: Spracherkennung (Konvertieren gesprochener Wörter in Text) und Sprachsynthese (Konvertieren von Text in natürliche Spracherkennung). Sie erfahren, wie diese Technologien zusammenarbeiten, um nahtlose Sprachinteraktionen zu erstellen und mehr über die realen Szenarien zu erfahren, in denen Sprache Die Benutzererfahrungen transformieren kann.
Hinweis
Wir erkennen, dass verschiedene Menschen gerne auf unterschiedliche Weise lernen. Sie können dieses Modul im videobasierten Format abschließen oder den Inhalt als Text und Bilder lesen. Der Text enthält größere Details als die Videos. In einigen Fällen sollten Sie also auf den Text als ergänzendes Material für die Videopräsentation verweisen.