只不过是采用比较缓和的方式来解决文字转WAV音频