这个显然会造成整个小组的被动文字转WAV音频