毕竟他们的日常训练早就习惯了这一套文字转WAV音频