从而选择出一个最优解文字转WAV音频