可以说是完全用资源堆起来的文字转WAV音频