前者代表传承文字转WAV音频