他们未必会顾忌脸面文字转WAV音频