不过按照气息分辨文字转WAV音频