在找到第二个区域的时候文字转WAV音频