可以说基本上保持着沉默文字转WAV音频