并且感知完成文字转WAV音频