因为只让一半的人抓取的话文字转WAV音频