大部分原因就在于他们缺乏知识文字转WAV音频