他都一概选择性的当没听见文字转WAV音频