根据掌柜的推断文字转WAV音频