现在纯粹是勉力维持文字转WAV音频