其实还是分布很均匀的文字转WAV音频