采集了足够的外形数据之后文字转WAV音频