基本标准就是刚才讲的那几条文字转WAV音频