沈迟的行为模式只会有两个文字转WAV音频