困难的是维持变化的长短文字转WAV音频