而是用整体的神态文字转WAV音频