然后发现模糊的只有第一句和第二句文字转WAV音频