确切的说是选出九人文字转WAV音频