这种能力还有一定的限制文字转WAV音频