应该一分为二的看待文字转WAV音频