他们做了一个相同的决定文字转WAV音频