就是有一半水分文字转WAV音频