当前位置:首页 > 新闻 > 正文

“机器之眼”,解码视觉感知技术的核心

发布时间: 2018-06-25 17:27   作者: 陈震   来源: 人工智能杂志

  感知功能是移动机器人所具备的基础能力之一,尤其针对包含复杂场景自主环境感知功能的机器人。此类移动机器人通常具备一套完善的多模态动态感知系统,成为近年来机器人领域研究的热点方向。移动机器人的应用场景众多,在工业化场景、商用服务机器人、家庭服务机器人、智能驾驶车辆等领域,均能见到包含该功能的机器人整体解决方案的应用,以提高人们在日常生产生活中的效率。除此以外,通过该类型机器人的部署,可以达到“机器换人”的目的,为企业、政府等部门缩减人力成本,提高机器的经营效率,从而为地区经济带来显著提升。

  一、国内外研究现状

  目前,国内外学术领域中创新算法研究与新型传感器的出现使得移动机器人领域的许多关键性技术正在被逐渐完善,移动机器人在定位导航等方面的应用效果得到了某种程度的提高。目前较为成熟的机器人室内定位与导航方案较多采用激光雷达作为主动视觉传感器,而采用这一方案除了需要面对价格高昂的传感器开发成本,在实际应用过程中有限的信息获取能力也会使携带单一激光雷达的移动机器人无法实现空间避障、地图构建、场景识别等其他必要功能,且其他类型传感器也需要被额外搭载。多传感器的数据融合与系统兼容等多维度的应用难题便由此产生。可见,在产业界的实际运用中,单一类型传感器的移动机器人缺乏市场化与产品化的基本前提。

  随着工厂自动化水平和自主导航算法整体水平的提高,逐渐出现了“二维码导航”、“激光导航”等自主感知的方式,颠覆了曾经电磁引导的物理式导航方式。在自动化运输中,移动机器人的重要性可谓举足轻重。

  相对于欧美和日本运输机器人产业的发展,国内对自动化运输机器人的研究和应用工作开展得相对迟缓,且主流的运输机器人依然停留在传统的电磁引导的物理式导航方式。国内从上世纪 60 年代开始研发自主导航机器人,但实际研究成果进展缓慢。中国人口红利在最近几年式微,其表现之一——人工成本不断上升,催生并发掘了运输机器人的市场价值。 研究人员开始投入更多精力开发更为完善且更具创新性的移动机器人感知算法。

  具备感知功能的智能物流运输设备在大型仓储车间、流水生产线、航空航天、大型码头等诸多工业领域可以更为高效、安全地实现无人作业。但现有的具备自主感知的移动机器人在实际应用中也遇到诸多问题,比如定位和导航精度不高、障碍物检测效率低等,尤其是非结构化场景中定位精度的下降又进一步加剧了对障碍物的检测难度。这些核心问题对设备自身安全和操作人员安全都造成很大的隐患。

  综上所述,开发实现具备感知功能,特别是实现多模态动态感知技术的移动机器人,通过多种传感器信息的融合提高现有移动机器人的自主感知与定位精度,可以更好地应用在工业仓储搬运、商用服务、家用服务、智能驾驶等多种环境中,从而为地区经济做出极大贡献。

  从上世纪 70 年代开始,世界主要发达国家——欧洲及美国开始对感知系统关键技术——尤其是定位、导航等感知技术开展了一系列卓有成效的研究工作。可以说,视觉感知系统的算法研发水平是标志和衡量一个国家智能机器人研究的最高标准之一。

  移动机器人所处的环境一般分为室外环境和室内环境,对感知算法的要求具有很大不同。相对于室外开阔的环境,室内环境中的导航与定位更具挑战性。首先,移动机器人所处的环境更为杂乱和狭小,这为机器人的信息采集增加了难度;其次,在室内环境下一般没有 GPS(Global Position System)等外部导航系统的支持,所以无法直接获取自身的位置信息。

  在过去近 20 年的发展中,无 GPS 信号场景中移动机器人定位导航技术的发展取得了一定成果。这主要归功于机器人身上装载的各种重量级高精度传感器,如激光雷达、声纳、摄像头、微电子机械系统等,以及由 Smith 等人于 1986 年提出的同时定位与构图(Simultaneous Localization and Mapping,SLAM)技术。

  近些年,随着硬件传感器的不断推陈出新,出现了多种类型的新型传感器,如颜色深度(RGB-D)相机、固态激光雷达、光场相机等。这些传感器利用先进的光学特性,可以采集到三维空间中的深度信息,大大提高了单一传感器的信息获取多样性,使得机器人视觉系统感知技术的实现有了更多选择。

  尽管颜色深度相机、固态雷达、光场相机等新型传感器具备诸多优点,但其自身依然存在缺点,比如:分辨率较低、测量距离有限、图像的噪声大、可视角度小、特殊情况下的数据丢失、成本居高不下等。从研究角度上看,这些问题需要依赖硬件的迭代、算法的优化以及市场的规模化开发得以解决。

  同步定位与地图构建技术、移动控制技术、轨迹优化技术这三者的结合构成了移动机器人感知功能的核心算法。在移动机器人的定位、建图、导航、规划能力等方面的研究成果最早被用于航空航天领域,其目的是为了解决人类发射升空的外星探测器、采集车在外星的未知复杂环境中与决策相关的一系列问题。经过了多年的技术完善与发展,这些成果在近年来逐渐普及,被更多的实验室及研究机构的研究人员用于解决智能车、飞行器、无人驾驶汽车等在未知环境下的感知等重要的基础性问题。

以上内容精选于《人工智能》杂志第四期

  本文作者

   陈 震

  速感科技创始人兼CEO,清华大学信息科学国家实验室信息交叉学科(计算机方向)专业硕士,师从中国人机交互领域著名学者史元春教授及微软亚洲研究院(MSRA)前主管研究员徐迎庆博士,欧洲特伦托大学及台湾交通大学访问学者,主攻机器人视觉交互技术,个人拥有十余项国家科技发明专利及相关学术论文。2012年到2014年在北京航空航天大学软件开发国家实验室从事视觉定位导航技术研究与国家级重大基础项目开发,曾作为主要负责人参与微软亚洲研究院与清华大学视觉技术联合项目研发工作。2017年入选“高聚工程”中关村高端领军人才,北京市海淀区“海英人才”,同年获美国福布斯杂志评选为中国30岁以下改变世界的青年精英。

  欲阅读完整文章,可通过以下方式购买《人工智能》杂志!

  订阅2018年《人工智能》杂志6期共计360元

  银行转账:北京赛迪出版传媒有限公司

  开户行及账号:北京银行北洼路支行20000030565000007701154

  银行转账,请备注:人工智能

  接收详细信息请发到:aiview@ccidmedia.com;或是添加客服微信:13601092749

收藏