오디오 형식 및 음성 구성하기
음성을 합성할 때 SpeechConfig 개체를 사용하여 Azure Speech Service에서 반환하는 오디오를 사용자 지정할 수 있습니다.
오디오 형식
Azure Speech Service는 음성 합성으로 생성된 오디오 스트림에 대해 여러 출력 형식을 지원합니다. 특정 요구 사항에 따라 필요에 따라 형식을 선택할 수 있습니다.
- 오디오 파일 형식
- 샘플링 레이트
- 비트 수준
예를 들어 다음 Python 코드는 speech_config 이전에 정의된 SpeechConfig 개체의 음성 출력 형식을 설정합니다.
speech_config.set_speech_synthesis_output_format(SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm)
지원되는 형식 및 해당 열거형 값의 전체 목록은 Azure Speech SDK 설명서를 참조하세요.
목소리
Azure Speech Service는 음성 지원 애플리케이션을 개인 설정하는 데 사용할 수 있는 여러 음성을 제공합니다. 음성은 로캘과 사람의 이름을 나타내는 이름으로 식별됩니다. 예를 들면 다음과 같습니다 en-GB-George.
다음 Python 예제 코드는 음성을 사용하도록 설정합니다.
speech_config.speech_synthesis_voice_name = "en-GB-George"
음성에 대한 자세한 내용은 Azure Speech SDK 설명서를 참조하세요.