虽然不是实时拍摄文字转WAV音频