但这是以社会平均的角度来看文字转WAV音频