简单地说……系统根本没给他生成身体文字转WAV音频