这里也的确是意识空间文字转WAV音频