所以他之前根本没有往这一层去想文字转WAV音频