他们肯定是要到现场的文字转WAV音频