还得继续收集文字转WAV音频