而且有很多的摄像死角文字转WAV音频