按照主体目前状态文字转WAV音频