他们拿的是笔文字转WAV音频