我会尽量控制其中的不稳定因素文字转WAV音频