大家讨论的是双方的动机文字转WAV音频