最重要的是这样一个模式开始建立起来文字转WAV音频