是不能用正常人的标准去衡量的文字转WAV音频