也许是为了表现出人多文字转WAV音频