在这个基础上咱们再加点附加条件文字转WAV音频