所以他能够做的只是提供帮助文字转WAV音频