然后和他们一同组装文字转WAV音频