这样做我们才会有一个可以预期的未来文字转WAV音频