就是在争取一种主动文字转WAV音频