第二和第三个条件不过是多提出来文字转WAV音频