第一个动作就是缩脖子文字转WAV音频