做出评判的不会是我们文字转WAV音频