如果是这样的话他们为什么还要告诉我准备接应文字转WAV音频