他们只能是提前做好准备文字转WAV音频