另外一个重要的原因是不能当着外人说的文字转WAV音频