所以他不会主动说话文字转WAV音频