他能直接理解对方话中含义文字转WAV音频