第二个环节为演武文字转WAV音频