你现在的构思设计不就是向这个方向发展么文字转WAV音频