我们才会进行第二阶段文字转WAV音频