他自然还是更加看重文字转WAV音频