那我们就等他愿意说时候再听他讲文字转WAV音频