并不会跟着人类一样会思考下一步该怎么做文字转WAV音频