这个时候也都全部转向文字转WAV音频