显然默认了这种争夺文字转WAV音频