再者就是从他的行为和举止来看文字转WAV音频