所以有一个很好的解决手段就是找一个分量足够大的人文字转WAV音频