演员给出的是一个触媒文字转WAV音频