推理下一步的行动文字转WAV音频