并且将第二人文字转WAV音频