其他人只是单纯的执行文字转WAV音频