就是一个没有确定的状态文字转WAV音频