因为他们要受到身份文字转WAV音频