也就是代离眼前文字转WAV音频