因为他们都会认为文字转WAV音频