并且将原本杂乱无章和过度冗余的信息进行优化和重设文字转WAV音频