而且他的准则就是文字转WAV音频