会話型エージェントのパフォーマンス問題を避けるには、よくある失敗ポイントを理解し、ベストプラクティスに従うことが重要です。
クォータと制限
RPM(リクエスト/分あたりのリクエスト、エージェントへのメッセージ)や24時間以内に許可されるPower Platformリクエスト数などの クォータや制限を理解しましょう。
エージェントにはクオータが適用され、 Microsoft Copilot Studioプランに伴う容量制約も適用されます。
エージェントのパフォーマンス最適化
エージェントのパフォーマンス最適化のために、以下のベストプラクティスを検討してください:
- APIコールやコネクタの呼び出しを会話フローに戦略的に配置し、ユーザーが複数回の完了を待たせるのを防ぎましょう。
- 該当する場合、キャッシュは複数のAPI呼び出しやフロー呼び出しを行うのではなく、 変数を使って情報を取得しました。
- Copilot Studioエージェントから呼び出すクラウドフローは遅延を引き起こす可能性があります。 代わりに ダイレクトコネクタコール や Send HTTP Request ノードの使用を検討してください。
- Copilot StudioにおけるClassic NLUと 生成オーケストレーション のパフォーマンスと複雑さのトレードオフを理解しましょう。 NLUモデルは特定の意図にはうまく機能しますが、複雑なクエリには苦手です。 生成AIモデルはより幅広い入力を処理しますが、遅延が発生することがあります。
- エクスプレスモードをオンにしてください。
クラウドフローをパフォーマンスに最適化しましょう
エージェントがPower Automateフローを呼び出す場合は、クラウドフローが最適化されていることを確認してください。
Power AutomateとPower Platform内の スロットリングや容量制限 についてしっかり理解してください。 これらの制限を守ることで、フローのスケーラビリティとパフォーマンスが向上します。
遅い流れのトラブルシューティングについて学びましょう。