又加了一个附加条件文字转WAV音频