它会占用研究员们的全部时间和精力文字转WAV音频