他判断到文字转WAV音频