就是它们能接受命令而生成反应文字转WAV音频