并没有本质上的冲突文字转WAV音频