一方面是他们新归顺的文字转WAV音频