是典型的缓冲区文字转WAV音频