他已经有一套自己的识人方法文字转WAV音频