最后不得不采用投票决定文字转WAV音频