专家团队的推测是文字转WAV音频