他原本只是基于自己掌握到的各种零碎信息文字转WAV音频