当然是因为现在的算法可以得到更多的信息呗文字转WAV音频