Mobileye,无人驾驶汽车的另一种可能
人生中顿悟的一刻到来时,阿姆农·沙舒瓦(Amnon Shashua)还是一个年轻的计算机专业本科生。那时他正坐在耶路撒冷一所大学的图书馆里阅读一篇用希伯来语撰写的文章,当时他兴奋地发现,在很多方面,人的视网膜与计算机十分相似。文章的作者是西蒙·厄尔曼(Shimon Ullman),计算机视觉研究先驱大卫·马尔(David Marr)的第一位博士生,也是人类与机器视觉专家。意识到人类的眼睛中也进行着计算后,沙舒瓦对这一过程十分着迷,他决定追随厄尔曼的研究脚步。
1996年,他来到麻省理工学院学习人工智能,而当时这一领域仍然在艰难地从早期繁荣与衰退的循环中恢复,各家公司也在着手打造建立在由早期人工智能先驱埃德·费根鲍姆(Ed Feigenbaum)和约翰·麦卡锡等人提出的规则和逻辑方法上的商业专家系统。在人工智能研究令人兴奋的早期阶段,似乎直接将人类专家的知识灌输给计算机就已经足够了,不过这样的项目在市场中却脆弱不堪,很快就让一些雄心勃勃的初创公司崩溃倒闭。而现在,人工智能的世界在反弹。虽然在第一个30年中,人工智能的发展相对停滞,但在20世纪90年代,由于统计技术的进步,分类和决策变得更为实际,人工智能也终于可以振翅腾飞了!可惜当时的人工智能实验并没有带来巨大的成绩,这主要是因为那个时代的计算机仍不足以处理手头的数据。不过,新的想法已经呼之欲出。
作为一名研究生,沙舒瓦将精力投入了一个颇有前途的技术——通过多个视角捕捉几何形状进行成像,从而识别物体。这一方法来自计算机图形学世界,是由犹他大学研究生马丁·纽维尔(Martin Newell)开创的一种全新的建模方法。20世纪70年代,计算机图形领域的很多进展都来自这所大学。纽维尔的灵感来源于厨房里的一个真实的美乐家(Melitta)茶壶。一天喝茶的时候,纽维尔与妻子讨论物体建模中出现的难题时,妻子建议他给面前的茶壶建模,后来,这只茶壶成了早期计算机图形学研究中的标志性图像。
在麻省理工学院,沙舒瓦师从计算机视觉科学家汤米·波乔(Tommy Poggio)和埃里克·格里姆森(Eric Grimson)。波乔的研究涉及神经科学和计算机科学,而格里姆森后来成了麻省理工学院的副校长。当时,从捕捉到识别形状的过程中看似没有障碍,但实际上编写识别软件却十分艰难。即便是在今天,“场景理解”的目标仍可望而不可即,例如,不仅识别出一个女人,同时也要识别出她可能做些什么。人们也仅是在一些小的领域取得了值得注意的进步。举例来说,现在很多汽车都能够及时识别出行人或自行车,从而在发生碰撞前自动减速。
通过脚踏实地钻研这些琐碎的技术,沙舒瓦逐渐成长为一位大师。在学术世界,脑科学家与计算机科学家还在争论不休的时候,他的立场很简单:“飞机不会扇动翅膀,但这并不意味着它们不能飞。”研究生毕业后,沙舒瓦回到了以色列。而在这之前,他还开办了自己的公司Cognitens,利用视觉建模技术对工业零部件进行精准三维建模。这些图像能准确到头发丝的级别,让从汽车到航天领域的制造商们能够对现有零件进行数字化建模,从而检查其是否合适。不过,他很快就出售了这家公司。
在寻找新项目时,沙舒瓦从以前一位汽车行业内的老客户口中听说,有汽车制造商希望能够实现加强计算机辅助驾驶的立体视觉技术。他们对沙舒瓦在多视觉几何领域的工作有所了解,于是询问他是否也对立体视觉有想法。他回答说:“这很好,不过你并不需要一个立体系统,一台简单的摄像机就够了。”他指出,在某些情况下,人类在闭上一只眼睛的情况下仍然能够判断距离。
凭借自己创业家的功力,沙舒瓦成功说服通用汽车公司投资20万美元用于开发演示软件。他立即叫来了自己在商界的朋友谢夫·阿维拉姆(Ziv Aviram),并建议创办一家新公司。“有个机会,”他这样告诉自己的好友,“这将是一个巨大的领域,以前每个人的思考方式都是错的,现在我们已经有了一个客户,已经有人愿意付钱了。”他们给新公司起名叫Mobileye,沙舒瓦亲自编写了台式机展示用的软件,然后展示了摄像头的机器视觉,这对当时的汽车制造商来说就好像是科幻小说一般。
项目开始6个月后,他从汽车行业一个大型供应商处得知,通用汽车公司计划展开一场竞标,寻求一种用来警告驾驶员车辆偏离车道的方式。在此之前,他们一直专注于更遥远的问题,比如车辆和行人探测,这些汽车行业的从业者们原本认为无法解决的问题。不过零部件供应商劝他:“你现在该采取行动了。重要的是先打入汽车内部,这样做以后,你才能有更多机会。”
沙舒瓦认可了这一策略,于是他让自己在希伯来大学的一个学生在这个项目上花了几个月的时间。让车辆在车道中保持行驶的软件写得还不错,但沙舒瓦却意识到,对于愿意率先起步的公司来说,这可能还不够好。因此,这家羽翼未丰的公司很难一举胜出。
后来,沙舒瓦有了一个好主意。他在这款软件中补充了车辆检测功能,但告诉通用汽车公司这个功能存在错误,不要在意。“在下一个版本中我们会解决它,所以你们可以忽略它。”他说。这一句话就已足够,通用汽车公司为能够以低成本检测其他车辆从而提升车辆安全性的想法欣喜若狂,于是决定立即取消投标,并承诺为这家新公司提供项目资金。车辆检测能够推进新一代安全功能的研发,这些功能并不会取代驾驶员,而是通过隐形的传感器、计算机安全网来增强车辆的安全性能。诸如车道偏离预警、自适应巡航控制前方碰撞预警和防碰撞制动等技术正在迅速向前发展,并成为汽车的标准安全系统。
Mobileye有机会成为全球汽车行业最大的人工智能视觉技术提供商之一,但沙舒瓦却有着更宏大的想法。在先后创建了两家公司之后,2001年,他到斯坦福大学继续自己的博士后研究,并与塞巴斯蒂安·特龙共用一间办公室。两人终将成为自动驾驶汽车的先驱。
人工智能关键思考
沙舒瓦追求的目标与特龙一致,但他的方法却更务实,而不是天马行空式的“登月”风格。他一直深受导师波乔的影响,后者一直崇尚用生物方法来研究视觉,这不同于依靠日益增强的计算机简单粗暴的力量来识别物体的方法。
当像谷歌云这样的超强计算机集群以及大数据集逐渐成熟时,用统计方法来进行计算将是最有效的。但如果没有这些资源该怎么办呢?沙舒瓦会在这里脱颖而出。Mobileye已经在以色列发展为一家出色的技术企业,公司位于耶路撒冷,距离希伯来大学不远,而沙舒瓦就在这所大学教授计算机科学课程。Mobileye Audi是一个车辆研究平台,但与挂满传感器的谷歌汽车不同的是,它的外形与普通汽车并无二致,只不过是在后视镜前、挡风玻璃中心的位置装了一台摄像机。手头的任务,即自动驾驶,需要功能强大的计算机,这些设备就藏在汽车的后备箱中,甚至还给行李箱留了些位置。
2013年春天的一个下午,Mobileye的两位工程师加比·海因(Gaby Hayon)和埃亚勒·巴贡(Eyal Bagon)在耶路撒冷东部的1号高速路上行驶了几公里。后来,他们在一个不起眼的路口停下,Mobileye的另一位员工正在路边停放的另一辆闪亮夺目的白色奥迪A7中等待。离开耶路撒冷的时候,加比和埃亚勒向一位访客道了歉。他们解释道,这辆汽车是一个研发中的项目。如今,Mobileye为包括宝马、沃尔沃、福特和通用汽车在内的汽车制造厂商提供用于安全应用的计算机视觉技术。据报道,这家公司的第三代技术能够检测行人和自行车。而不久前,日产也展示了公司在这一领域内的成果——为避免碰撞从停靠的汽车后突然走出的行人,车辆自动急转。
像谷歌一样,这些以色列人也进行过深入研究,开发出了自动驾驶所必需的技术。谷歌可能会计划与新贵特斯拉合作,发起对汽车行业的竞争,但沙舒瓦却对汽车行业的文化极其敏感,这从Mobileye目前合作的客户中就可以窥见。这意味着他的视觉系统设计必须控制成本,即使是高端汽车,花费也不能超过数百美元,而对一辆普通的雪佛兰轿车,成本甚至不可以过百。
谷歌和Mobileye采用了不同方法来解决相同的问题,他们需要帮助车辆知晓周围的情况,在高速条件下,这些判断需要优于人类的准确度。谷歌的系统需要通过雷达、视频、Velodyne LIDAR传感器对汽车周围的环境进行精细到厘米级别的测绘,增强通过街景车采集到的数据。这些谷歌无人驾驶汽车是通过与谷歌云的无线连接来获得地图数据的。这一网络对谷歌无人驾驶汽车的导航系统来说就好像一根无形的电子拐杖,确认着传感器看到的周围世界。
全球地图数据库能让谷歌的工作变得更容易。谷歌的一位工程师透露说,在这一项目启动之后,他们惊讶地发现,这个世界上竟然有这样多的变化。不仅高速公路的车道经常会因为维护等问题而出现变化,“连整座桥都会移动”。他说。即使不依靠数据库,谷歌无人驾驶汽车也能做到很多似乎只有人才能办到的事情,比如完美地融入高速公路的车流,或是在车水马龙的密集市区应对时停时走的交通。
谷歌的项目结合了特龙德国式的精密以及公司对保密的情有独钟,但以色列人却更不拘小节。一个春日温暖的下午,身在耶路撒冷郊区的Mobileye的工程师们并没有谷歌人的谨慎。“你为什么不来试试?”埃亚勒对一位游客说,然后这位工程师就滑到了乘客座位上,坐在一个大显示器和键盘后面。之后,他们开始了时长1分钟的快速机器人汽车驾驶课程:你只需要开启巡航控制,然后添加车道保持功能,将方向盘上巡航控制拉杆拉向自己。挡风玻璃上的投影向驾驶员展示了汽车的速度,并有图标提示自动驾驶功能正处于开启状态。
与配有《星际迷航》启动音乐的谷歌无人驾驶汽车不同的是,Mobileye在切换如自动驾驶模式的时候只有一个小小的视觉提示。Mobileye Audi在高速公路上飞驶,有时候速度会超过每小时90公里。在通向死海的峡谷中蜿蜒盘旋而下时很难感到放松。而在一辆自动驾驶汽车中,对新手驾驶员来说,非常具有挑战性的是前方有车因红绿灯而放慢了速度的时候。这需要所有人的意志力:让脚离开刹车板,并给予这辆车足够的信任。果然,它逐渐减速,平稳地停在了前面那辆车后。
谷歌无人驾驶汽车带给人们的体验是一种分离感——幕后那些略显怪异的机器智能设备,还有那些遥远的云计算机。而与此形成鲜明对比的是,2013年的测试阶段证明,Mobileye无人驾驶汽车能让车上的乘客敏锐地感觉到机器援助的存在。这款车需要在车道内略微移动,然后结束停车状态并绝尘而去——这样的行为无法激发人们的信心。不过,如果你了解底层技术,这样的插曲就不会那么让人害怕了。Mobileye Audi的视觉系统采用了一个“单眼”相机。第三个维度——深度,是通过沙舒瓦和他的研究人员设计的一个巧妙的算法计算得出的,这一技术也被称为“从运动中构建”,只需要略微移动车身,这辆汽车就能绘制出前方世界的3D地图。
不过知道这一切对第一次体验Mobileye无人驾驶汽车的乘客来说仍然起不到安慰作用。在一次试驾中,在掠过一辆停在路边的汽车时,Mobileye Audi突然朝那辆车开去。首次体验的乘客完全不想知道车的“真正的想法”,他们会一把转过方向盘,把车重新带回车道中心。不过,这些以色列工程师们并没有感到惊慌,甚至还流露出一丝愉悦的表情。沿着这条看上去还带有古韵的老路行驶了约半小时,行程结束。乘坐自动驾驶汽车的体验就像科幻小说中的感觉一样,不过这只是这一技术将逐渐带来广泛社会改变的第一个暗示。“交通拥堵辅助系统”已经在市面上出现了。2013年,在游览以色列的游客看来了不起的技术,在短短3年之内,如今已在全世界的高速公路上行驶。
自动驾驶汽车的下一阶段将在2020年之前到来——车辆将接手日常驾驶任务,不仅在塞车时,每天通勤的路上也是。通用汽车公司将这一功能称为“超级巡航”(Super Cruise),它标志着人类司机的角色将会出现转变——从手动控制到监督。
人工智能关键思考
谷歌的目标十分明确,这家互联网巨头希望打造新一代汽车,而人将成为乘客,不再需要参与驾驶任务。不过沙舒瓦认为,即使对谷歌来说,完全无人驾驶的汽车也仍然只存在于遥远的未来。完全无人驾驶的汽车将陷入他所描述的一种四向停车难题(four-way stop)。在没有红绿灯的路口,司机之间需要复杂的交流,而对于相互独立、互不连通的计算机系统来说,在可预见的未来想解决此类问题则更为困难。
另一个复杂之处在于,人类司机经常会违背或忽略交通规则,而行人也带来了很多难以处理的问题。这些挑战或许将成为未来完全建立在人工智能基础上的汽车在城市环境中发展的阻碍:我们还没有厘清人工智能车辆造成的事故在法律上如何界定。沙舒瓦认为,一个折中的可能性是,未来可能仍然不属于谷歌高瞻远瞩的全机械智能车,不过或许再过几年,机器人车就能接管高速公路的驾驶。他的方法中加入了复杂的传感器阵列以及关注人类驾驶员的人工智能软件,拥有超强意识的人类能够看得更远、更清晰,也许还能轻松切换到驾驶之外的其他任务上。未来的车辆能够根据驾驶员的喜好或者汽车自己的喜好提醒他是否应该参与驾驶过程。
站在耶路撒冷城郊的那辆Mobileye Audi车旁,这里就像是新的乐土。无论你是否愿意,我们已经不再身处那个《圣经》中的世界,未来并不是地理上的领地,而是一个迅速逼近的技术的奇妙世界。机器将从魔像开始,逐渐变得越来越智能,并接管许多人类的任务,从简单的体力劳动到高深的科学。