就是尽量在最短的时间内文字转WAV音频