次の方法で共有


会話エージェントのパフォーマンス向上のベストプラクティス

会話型エージェントのパフォーマンス問題を避けるには、よくある失敗ポイントを理解し、ベストプラクティスに従うことが重要です。

クォータと制限

RPM(リクエスト/分あたりのリクエスト、エージェントへのメッセージ)や24時間以内に許可されるPower Platformリクエスト数などの クォータや制限を理解しましょう。

エージェントにはクオータが適用され、 Microsoft Copilot Studioプランに伴う容量制約も適用されます。

エージェントのパフォーマンス最適化

エージェントのパフォーマンス最適化のために、以下のベストプラクティスを検討してください:

  • APIコールやコネクタの呼び出しを会話フローに戦略的に配置し、ユーザーが複数回の完了を待たせるのを防ぎましょう。
  • 該当する場合、キャッシュは複数のAPI呼び出しやフロー呼び出しを行うのではなく、 変数を使って情報を取得しました。
  • Copilot Studioエージェントから呼び出すクラウドフローは遅延を引き起こす可能性があります。 代わりに ダイレクトコネクタコールSend HTTP Request ノードの使用を検討してください。
  • Copilot StudioにおけるClassic NLUと 生成オーケストレーション のパフォーマンスと複雑さのトレードオフを理解しましょう。 NLUモデルは特定の意図にはうまく機能しますが、複雑なクエリには苦手です。 生成AIモデルはより幅広い入力を処理しますが、遅延が発生することがあります。
  • エクスプレスモードをオンにしてください。

クラウドフローをパフォーマンスに最適化しましょう

エージェントがPower Automateフローを呼び出す場合は、クラウドフローが最適化されていることを確認してください。