他们只能依靠人数压过去文字转WAV音频