总之这理就是给人用的文字转WAV音频