所以根据我们带回来的信息文字转WAV音频