대화형 에이전트의 성능 문제를 피하려면 흔한 실패 지점을 이해하고 모범 사례를 따르세요.
할당량 및 제한
RPM(분당 요청, 요청은 에이전트에게 보내는 메시지)와 24시간 내에 허용되는 Power Platform 요청 수 같은 할당량과 한계를 이해하세요.
에이전트 쿼터와 Microsoft Copilot Studio 플랜에 따른 용량 제한이 적용됩니다.
에이전트의 성능을 최적화하세요
에이전트의 성능을 최적화하기 위해 다음 모범 사례를 고려하세요:
- API 호출과 커넥터 호출을 대화 흐름에 전략적으로 배치하여 사용자가 여러 번 완료되는 것을 기다리지 않도록 하세요.
- 해당되는 경우, 캐시는 여러 API 호출이나 플로우 호출 대신 변수를 사용하여 정보를 검색했습니다.
- Copilot Studio 에이전트에서 호출되는 클라우드 흐름은 지연 시간을 유발할 수 있습니다. 대신 직접 커넥터 호출 이나 HTTP 요청 전송 노드를 사용하는 것을 고려해 보세요.
- Copilot Studio에서 Classic NLU와 생성 오케스트레이션 의 성능과 복잡도의 균형을 이해하세요. NLU 모델은 특정 의도에는 잘 작동하지만 복잡한 쿼리에는 어려움을 겪습니다. 생성형 AI 모델은 더 넓은 범위의 입력을 처리하지만 지연 시간을 초래할 수 있습니다.
- 익스프레스 모드를 켜세요.
클라우드 흐름을 최적화해 성능을 확보하세요
에이전트가 Power Automate 플로우를 호출한다면, 클라우드 플로우가 최적화되었는지 확인하세요.
Power Automate와 Power Platform 내의 스로틀링과 용량 제한 을 반드시 이해하세요. 이러한 한계를 준수하면 흐름의 확장성과 성능이 향상됩니다.
느린 흐름 문제 해결에 대해 알아보세요.