在考虑以上两点的基础上文字转WAV音频