他们只能分头准备文字转WAV音频