Freigeben über


Effizient und natürlich sein

[Der Microsoft-Agent ist ab Windows 7 veraltet und kann in nachfolgenden Versionen von Windows nicht verfügbar sein.]

Bei der Durchführung von Aufgaben werden effektive menschliche Unterhaltungen in der Regel von kurzen Informationen ausgetauscht. Häufig werden Elemente in der Diskussion zwischen den Parteien etabliert und dann indirekt mit abgekürzten Antworten verwiesen. Diese Abkürzungsformen sind von Vorteil, weil sie effizient sind und auch bedeuten, dass der Sprecher und Zuhörer einen gemeinsamen Kontext haben; das heißt, dass sie kommunizieren. Die Verwendung geeigneter Abkürzungsformen macht auch einen Dialog natürlicher.

Eine Form der Unterhaltungsabkürzung ist die Verwendung von Kontraktionen. Wenn sie nicht verwendet werden, erscheinen sie einen Sprecher formaler und starrer und manchmal weniger menschlich. Die meisten menschlichen Unterhaltungen zeigen mehr Freiheit in den sprachlichen Regeln als geschriebenen Text.

Eine weitere gängige Abkürzungsform in Unterhaltungen ist Anaphora, die Verwendung von Pronomen. Wenn jemand beispielsweise fragt: "Haben Sie heute Bill gesehen?" Antworten, die ihn durch "Bill" ersetzen, sind natürlicher als die Wiederholung des Namens. Die Ersetzung ist ein Hinweis darauf, dass die Parteien im Dialog einen gemeinsamen Kontext von teilen, der "ihn". Denken Sie daran, dass sich das Wort "I" auf das Zeichen bezieht, wenn er es sagt.

Der gemeinsame Kontext wird auch durch die Verwendung sprachlicher Auslassungspunktekommuniziert, die Abkürzung vieler Wörter in der ursprünglichen Abfrage. Beispielsweise könnte der Zuhörer antworten: "Ja, ich habe ihn gesehen", zeigt den gemeinsamen Kontext von , wenn oder sogar mit einem einfachen "Ja" antworten, der den gemeinsamen Kontext von , die und , wenn.

Implizites Verständnis kann auch durch andere Formen der abgekürzten Unterhaltungsformatvorlage vermittelt werden, wobei Inhalte ohne Wiederholung abgeleitet werden, wie im folgenden Beispiel gezeigt:

Benutzer: ich möchte eine Pizza im Chicago-Stil.

Charakter: Mit "Extra Käse"?

Wenn jemand sagt, "Es ist hier heiß", ist der Ausdruck verständlich und erfordert keine weiteren Details, wenn Sie wissen, wo der Sprecher ist. Wenn der Kontext jedoch nicht gut etabliert ist oder mehrdeutig ist, können alle kontextbezogenen Verweise den Benutzer verwechseln.

Berücksichtigen Sie bei der Verwendung der abgekürzten Kommunikation immer den Kontext des Benutzers und den Inhaltstyp. Es ist angemessen, längere Beschreibungen für neue und unbekannte Informationen zu verwenden. Selbst bei langen beschreibenden Informationen versuchen Sie jedoch, sie in kleinere Blöcke aufzuteilen. Dadurch können Sie die Animation ändern, während das Zeichen spricht. Außerdem bietet es dem Benutzer die Möglichkeit, das Zeichen zu unterbrechen, insbesondere bei der Verwendung von Spracheingaben.

Konsistenz ist bei der Sprachausgabe wichtig. Seltsame Sprachmuster oder Prothesen können als Herabstufung der Intelligenz des Charakters interpretiert werden. Ebenso kann der Wechsel zwischen TTS und aufgezeichneter Sprache dazu führen, dass Benutzer den Charakter als seltsam interpretieren oder mehr als eine Persönlichkeit besitzen. Lipsynchrone Mundbewegungen können die Verständlichkeit der Sprache verbessern. Microsoft Agent unterstützt automatisch die Lip-Sync für TTS-Engines, die den erforderlichen SAPI-Schnittstellen entsprechen. Die Sprachsynchronisierung wird jedoch auch für aufgezeichnete Sprachaufzeichnungen unterstützt. Sounddateien können auch mit dem Microsoft Linguistic Sound Editing Tool verbessert werden.