所以他们想安排另外一种分别模式文字转WAV音频