他们只能一边采访文字转WAV音频