后者则主持行动文字转WAV音频