主要是为了加强观众的刺激感受文字转WAV音频