并且还可以在推演的基础上文字转WAV音频