从第一剑中他就能推测出文字转WAV音频