他们需要传送几次也要时间文字转WAV音频