他的目标只是通过考核文字转WAV音频