前者指的其实质文字转WAV音频