因为这里的人几乎都是单一元素的文字转WAV音频