谷歌创业帮:关于梦想、创新、勇气与坚持
上QQ阅读APP看书,第一时间看更新

第4章 颠覆性创新(1)

只要你是在改变世界,那么你就是在从事伟大的事业。每天清晨起床都会兴奋不已。

——拉里·佩奇

人工智能狂想曲

在20世纪60年代的科幻电影《2001太空漫游》中,美国导演斯坦利·库布里克描述了他幻想中的未来世界:宇宙飞船徘徊在外太空,人们试图在星空中寻找生命的起源;一部叫“HAL9000”的高智能电脑,成为帮助人类开启与世界对话的重要工具;电影配乐是奥地利著名作曲家约翰·施特劳斯的《蓝色多瑙河》,当优雅瑰丽的音乐响起,人们发现原来冰冷的外太空竟也可以谱写一曲浪漫的交响曲……这些场景,正是人们在数十年前对未来世界的构想,驾驭飞船和对话机器人,则是人机交互的完美理想。

事实上,当这部电影在1968年上映时,人类还没有真正登上过月球(1969年,尼尔·阿姆斯特朗随阿波罗11号宇宙飞船登月,成为第一个踏上月球表面的人类),人工智能(Artificial Intelligence, AI)也不过是科学家仅仅提出10年的概念——20世纪50年代,美国科学家企图凭借计算机技术生产出一种以与人类智能相似的方式做出反应的智能机器,而随着60年代美国另一部科幻系列电影《星际迷航》的上映,无数狂热的科技爱好者开始投身于这项研究中,并将之视为终身事业。

人工智能的发展并非一条坦途。这项技术以人的器官感知为基础,包括“看得到”的计算机视觉、“听得到”的语音识别、以“理解”为基础的自然语言处理等。尽管这听上去十分美妙,科学家也以为计算机诞生后的数年内人工智能就能实现,但现实却有些残酷。几十年过去了,尽管计算机的运算速度已经提升到每秒数千万次,IBM公司研制的深蓝计算机在1997年5月战胜了国际象棋大师卡斯帕洛夫,科学界也提出试图复制人类大脑的蓝脑计划(Blue Brain Project),但是,人工智能的难点仍在于“训练”一台机器拥有人类的思考方式、思维逻辑甚至情感。从这个角度上看,真正的人工智能貌似还遥遥无期。

不过,近年来的一些迹象似乎让人工智能的苗圃绽放出希望之花——一方面,大数据的爆炸式发展让人们对机器研究获得了更多的数据积累;另一方面,世界顶级公司也不断投入重金推动人工智能研究:2014年,IBM公司承诺拨出10亿美元使认知计算平台Watson商业化;谷歌连续收购8个机器人公司和一个机器学习公司;Facebook(脸谱网)聘用人工智能学界泰斗燕乐存(Yann LeCun)创建自己的人工智能实验室……这让人工智能理想的实现有了极大可能。

计算机视觉、机器学习、语音识别、自然语言处理……成了巨头们的新角斗场。视人工智能为终极目标的谷歌,则在“秘密”实验室里云集了数百位科学大咖。赵勇、李志飞即出于此。

格灵深瞳创始人赵勇,在回国前是美国谷歌研究院高级科学家(senior research scientist),曾被“雪藏”在Google X(谷歌秘密实验室)里进行了3年的专项研究。他在美国学习、工作11年,获布朗大学计算机工程系计算机视觉方向博士学位,并曾在NVIDIA、三菱电器、爱普生、HP实验室工作。而他让很多中国开发者知道则是因为他所从事的一个项目,用赵勇的话说,现在这个项目变得“有点”影响力了——这就是谷歌眼镜(Google Glass)。

另一位知名自然语言处理专家李志飞,博士毕业于美国约翰·霍普金斯大学语言语音处理实验室(CLSP),是谷歌手机离线机器翻译系统和学术界主流开源机器翻译软件Joshua的主要开发者,他曾在国际一流会议和杂志发表30余篇论文,获国际计算语言学协会(ACL)最佳论文提名奖。他先后任职于美国微软研究院和美国谷歌研究院,从事语音识别、自然语言处理、机器翻译、手写识别等领域的核心算法研究和开发。2012年,李志飞回国创业,立志于开发出基于自然语言处理的下一代移动搜索引擎。

神秘的Google X

近两年来影响甚广的谷歌眼镜,被认为是智能消费领域的重要进步,因为它开启了人类日常穿戴与科技结合的先例。然而不为人知的是,智能穿戴研究在美国已经进行了数十年。赵勇给我讲述了他的同事萨德·斯塔那(Thad Starner)的故事。这位佐治亚理工大学教授,从20世纪80年代起,就将一个特别的眼镜戴在脸上。在一段20多年前的电视节目中,斯塔那对主持人“口出狂言”:“我可以回答关于任何事的任何问题!”于是主持人问:“你是否了解棒球?”斯塔那摇头。主持人说:“那么我想知道关于××球员的生平的纪录。”要知道,这个活跃在20世纪40年代的球员当时早已退役。但仅仅三秒钟后,斯塔那就将这个球员所有的比赛数据公布出来——他随身携带电脑,配以自己研发的非键盘式输入设备,几秒钟后,电脑将因特网上搜取的答案传至眼镜中,在交谈中,这些数据被读取出来。“这件事发生在20世纪80年代末90年代初,那时我们的计算机还是286、386。现在萨德·斯塔那已戴着这个玩意生活了20多年,你能想象吗?”赵勇说。

三年前,当赵勇在一个内部会议上做完关于谷歌眼镜的规划报告后,散会时有个行为怪异、态度似乎有些暧昧的人走到他背后低声说:“我觉得咱们俩应该共进午餐!”赵勇当时甚至想,这个人不会是同性恋吧?

原来此人正是萨德·斯塔那。会后,他和赵勇来到会议室交谈,在整个过程中,带着一副造型奇特的眼镜的斯塔那默不作声,只是动手将电脑与投影仪相连,投影中很快出现了斯塔那眼镜里呈现的内容。赵勇用嘴说,斯塔那打字,但速度却比说话还快。

更奇特的故事还在后面。赵勇向自己的上司、前布朗大学计算机系主任汤姆·迪恩(Tom Dean)描述了这个怪人。后者说:“我记得他。20多年前,桀骜不驯、行为古怪的斯塔那毕业时曾来布朗大学应聘,我是面试官。一个教授说如果布朗大学肯给他工作机会,我就辞职。所以我没有录用他。”于是,当赵勇和迪恩再次约见斯塔那一起晚餐时,赵勇提及了20年前那次面试经历。显然,斯塔那已经记不清眼前这位拒绝他的老教授了。但几秒钟后,他就叫起来——原来,20年前的场景一一呈现在他眼前,这些年间,他用眼镜记录了所有语音信息,并将其转化为知识、笔记放进搜索库随时调取。

最终,萨德·斯塔那成为赵勇在谷歌眼镜项目上的合作伙伴。

不过,并非每位科学怪咖都能得到谷歌的垂青。多伦多大学的教授史蒂夫·曼恩(Steve Mann)就没那么幸运了。过去30年间,这位有些“走火入魔”的教授,在自己的头上“安装”了一个佩戴非常麻烦的仪器——他剃光头发,从大脑中提取各种信号去训练它,并试图用自己的意念控制它。这就像脑电波传感器从脑子里提取东西,用以分析人们在想什么事,然后根据信号变化寻找规律,通过规律用眼球、大脑来控制外部设备。显然,这个设备非常“侵入式”,曼恩整个人也看起来有些神经质。为了避免引起误会和麻烦,他不得不随身携带医师证明。“他是这个学术方向的先驱者,至少走在了一般人前面50年,所以才在那个时代显得有点格格不入。”赵勇说。而在谷歌,当时最担心的就是做出一个令消费者产生这种“恐怖”感的产品。所以,当设计谷歌眼镜时,大家就想象一位20岁的年轻姑娘戴着它走进商场的样子。因此,这才是人们今天看到的谷歌眼镜。

对于有各种奇思妙想的Google X而言,谷歌眼镜不过是其中的一个项目而已。尽管谷歌工程师拥有令人艳羡的薪水、有趣的研发项目以及可观的科研经费,但赵勇还是选择离开。“在谷歌工作,尤其是在Google X,所有项目都非常非常具有创新性,很多人都是企业家、发明家,是被谷歌买进或者请进的。而我常常会有一种很强烈的冲动,他们都可以做这些伟大的事情并且让结果发生,为什么我不能?”

“我想成就理想,而不是做谷歌翅膀下的一个蛋。”2012年年初,当作为谷歌眼镜核心研发人员的赵勇看到团队的想法和研发已经变为产品,接下来就是交给工程师如何把它做得更轻、更漂亮时,他有了自己新的创业想法。

从硅谷到中国

赵勇还在读博士时曾研究过一个项目,他一直相信会变成现实,但当时技术尚不成熟。后来到谷歌工作,研究领域和产业有了发展,接近成熟和应用,赵勇觉得这个时机快到了。虽然从很多企业家和工业标准来看它还非常超前,但这正是其魅力所在。“我不想等它成熟了才回来,我要让它变成熟。”赵勇想。

他想做的,是一套基于计算机视觉和模式识别技术,利用新传感器和技术进行安全监控和客流行为的智能分析系统,为商业决策提供数据驱动。简单理解,这就像给机器装上更精密的眼睛和大脑,使它能够看懂世界。人的记忆有限,不可能记录下经历的每一个画面、说出的每一句话,但机器可以帮助人们从多维世界中获取、处理、理解和分析这些信息,然后通过深度学习,即计算机算法,从历史数据中掌握规律,并对事物做出智能识别和预测。

具体来说,比如应用在监控安防领域。如果一个商场丢了东西,人们只知道有东西丢了,却不知何时丢的,可能是过去一天,也许是一周,这就需要播放监控录像进行查找,但24小时的录像即使快进也要三四个小时播放,且人工查找容易遗漏细节。而如果有了这样一个“智能眼”,两分钟内就可以完成这一切。除了安全监控领域,这个“智能眼”还可以应用到商业、艺术等领域,了解不同年龄、不同时间段人们的行为和轨迹,进行商业分析和艺术展示等。

2013年,当赵勇刚刚回国创业时,他从科学上做出了对这项技术的阐释,但他随后说:“从商业的角度讲它还不存在。”不过,他自己也没想到的是,400多天后,他的设想已经变成现实中的产品,他创办的格灵深瞳也成为科技圈里颇有名气的酷公司,甚至微软创始人比尔·盖茨在私访中国时也将他的公司作为会见的第一家创业公司——这也是他此次出行中唯一造访的计算机视觉公司。2014年年初,盖茨曾对外透露,科技界的下一个大事件是计算机视觉与深度学习(deep learning)的结合。难怪他在看了赵勇的项目后,由衷地称赞:“这真的很酷!”

从大公司到创业者

“我们这群搞人工智能的人就像是玻璃罐里的苍蝇,前面似乎永远是光明的,直到你碰壁。”在回国后的一次公开演讲中,赵勇引用导师的一句话来形容他所从事的这门学科风光却又尴尬的现实。这虽是一句玩笑话,但正恰似从美国实验室回到中国的赵勇,他的创业也经历了从与世隔绝的“真空”到现实落地的过程。

找到默契的合作伙伴并非易事。从谷歌辞职准备创业,赵勇很快就遭遇了第一个困境——找到性情相投的合作伙伴。当他面对投资人时,曾听到关于创新的两种不同声音:一方面,投资人觉得震撼;另一方面又觉得恐惧。有人对他说:“我从来没投过这些项目,看不到成功的案例。”只有一小部分投资者说:“这听上去很棒,我们愿意投。”“在中国我感觉这样的投资人连10%都不到。”赵勇一度与投资方签好意向书,但当他从美国回来时对方却反悔了,他不得不重新融资。“时间环境会变,可能一度很火的概念,随着时间推移大家的想法会变。”幸运的是,重新融资的过程还算顺利。

第二个困境则是寻找一个商业人才。当产品还在概念期,赵勇就有一个很技术化的想法,但对具体的产品设计还很模糊。他曾带着一个麻省理工学院的学生会主席和其他公司谈商务,这个优秀的年轻人曾上过电视节目,沟通能力也很强,甚至还在麻省理工创办过技术协会。但真的坐在谈判对象面前,两个技术狂人却不知该说什么,有时跟对方谈了两三次后才发现对方是想要收购他的公司。“这时我意识到他跟我一样都是搞学术的工程师。我需要一个真正商务方面的伙伴,他很重要,必须是联合创始人。”在这种需求下,投资人向赵勇引荐了何搏飞。和赵勇的经历很不一样,何搏飞大学毕业后就在中国工作,获得很多本土经验后,又到斯坦福大学商学院念书,随即再回到中国。认识赵勇前,他已经做过两个在美国上市的中国公司总经理。“他是一个商业人才,商业意识非常好。”赵勇第一次和何搏飞见面,是在后者位于国贸的一间宽敞的办公室里。“但后来他到我创业的民宅看我,瞬间就被我们的气氛吸引了,决定加入我们。我给他找了个很小的格子间,说,你是我们公司第一个商务。”于是,一个是仰望星空的科学天才,一个是久经商业沙场的商业精英,这样的金风玉露相逢,格灵深瞳才开启了自己的商业格局。