只能纪录基础信息文字转WAV音频