다음을 통해 공유


대화 에이전트 성능 향상을 위한 모범 사례

대화형 에이전트의 성능 문제를 피하려면 흔한 실패 지점을 이해하고 모범 사례를 따르세요.

할당량 및 제한

RPM(분당 요청, 요청은 에이전트에게 보내는 메시지)와 24시간 내에 허용되는 Power Platform 요청 수 같은 할당량과 한계를 이해하세요.

에이전트 쿼터와 Microsoft Copilot Studio 플랜에 따른 용량 제한이 적용됩니다.

에이전트의 성능을 최적화하세요

에이전트의 성능을 최적화하기 위해 다음 모범 사례를 고려하세요:

  • API 호출과 커넥터 호출을 대화 흐름에 전략적으로 배치하여 사용자가 여러 번 완료되는 것을 기다리지 않도록 하세요.
  • 해당되는 경우, 캐시는 여러 API 호출이나 플로우 호출 대신 변수를 사용하여 정보를 검색했습니다.
  • Copilot Studio 에이전트에서 호출되는 클라우드 흐름은 지연 시간을 유발할 수 있습니다. 대신 직접 커넥터 호출 이나 HTTP 요청 전송 노드를 사용하는 것을 고려해 보세요.
  • Copilot Studio에서 Classic NLU와 생성 오케스트레이션 의 성능과 복잡도의 균형을 이해하세요. NLU 모델은 특정 의도에는 잘 작동하지만 복잡한 쿼리에는 어려움을 겪습니다. 생성형 AI 모델은 더 넓은 범위의 입력을 처리하지만 지연 시간을 초래할 수 있습니다.
  • 익스프레스 모드를 켜세요.

클라우드 흐름을 최적화해 성능을 확보하세요

에이전트가 Power Automate 플로우를 호출한다면, 클라우드 플로우가 최적화되었는지 확인하세요.