而他们选择的是最保守的方式文字转WAV音频