第一轮的测试就是文字转WAV音频