前者代表质文字转WAV音频