大部分都选择了自行离开文字转WAV音频