我觉得我应该在场支持文字转WAV音频