并且他们表示是他们亲眼所见文字转WAV音频