可能是为了适应社会文字转WAV音频