其实我们很多时候都是和被人谈条件的文字转WAV音频