第一个条件倒是简单处理文字转WAV音频