而是先默读了一遍文字转WAV音频