Zusammenfassung

1 Minute

In diesem Modul haben Sie über audiofähige generative KI-Modelle und die Implementierung von Chatlösungen gelernt, die audiobasierte Eingaben enthalten.

Mit audiofähigen Modellen können Sie KI-Lösungen erstellen, die Audio verstehen und auf verwandte Fragen oder Anweisungen reagieren können. Außer nur gesprochene Wörter zu identifizieren, können einige Modelle auch die Begründung auf der Grundlage des Hörens verwenden. Beispielsweise können sie eine Nachricht zusammenfassen oder die Stimmung des Sprechers bewerten.

Tipp

Weitere Informationen zum Arbeiten mit multimodalen Modellen in Microsoft Foundry finden Sie unter Verwenden von Bild und Audio in Chatabschlussen mit Azure AI-Modellableitung und Schnellstart: Verwenden von Sprach- und Audiofunktionen in Ihren KI-Chats.

Feedback

War diese Seite hilfreich?