试图寻找一个平衡的出口文字转WAV音频