他需要仔细梳理一下文字转WAV音频