基本上这两个人可以认为是一个组合文字转WAV音频