后期则是对部分重地放弃得太快文字转WAV音频