但要顾及妆容和食相文字转WAV音频