最终把目标缩减到一个文字转WAV音频