不过受限于场地文字转WAV音频