因为只是单纯的气势文字转WAV音频