这个时候他是焦点的焦点文字转WAV音频