让它们初步演绎成文字转WAV音频