他们可以提出条件文字转WAV音频