我甚至都不能确定他是否就是一个完整的人文字转WAV音频