其实二人也都感应到了文字转WAV音频