其实是追封文字转WAV音频