第7章 颠覆性创新(4)
2004年,李志飞赴美留学。在此之前他的专业是无线通信,但在计算机领域,这属于偏系统的学科。当时,李志飞面前有三个选择:第一个选择是继续系统方向的研究,比如操作系统、计算机网络等学科;第二个选择比较偏理论,比如算法,要研究哪些东西可行、哪些不可行;第三个选择则是在应用领域,美国会关注一些未来应用,学校里所学的很大一部分都与人工智能相关,包括自然语言处理、语音识别,还有计算机视觉等方向。虽然自己研究过系统,也算有意思,但对用户来说,李志飞觉得通信协议对普通用户来说是看不见摸不到,过于机械化;如果搞理论研究,自己没有相关背景,也没有太大兴趣。衡量再三,他决定选择应用。从实用的角度讲,他希望自己研究的东西,能够真正为用户解决一些问题,而不仅仅是发表论文,取得学术上的成就。
事实上,在去美国前李志飞就早有创业打算。2000年,他曾在南京一家从事手机上网业务的初创公司移软工作,见证并参与了移软从几个人的创业公司发展到数百人,并被美国Palm公司收购的过程,这一经历使他对创业这件事兴致浓厚。同时,在创业方向上李志飞也有大致思考,他希望做一个产品,它很酷,但同时又能为更多用户服务。还有就是他相信移动领域将大有可为。
在谷歌时,李志飞曾从事一项他认为颇有意义的项目,即把谷歌在线翻译移植到手机上。坦率来说,当时他的上司并不支持这个项目,很多同事也对这个棘手的项目不太有信心。因为其难点在于,在PC互联网上,每一个命令需要几千台机器同时运算,内存基本上也是无限的;但如果用手机来重新运行系统,却只有几十兆存储量,CPU的速度也较慢,而且有诸多限制,因此在大规模降低存储的前提下,将整个系统表现出来难度非常大。在工程上,这也是一个巨大挑战,由于系统复杂,要对工程、算法非常熟悉,才可能在手机上做出一个既好用又结合多种语言,同时符合谷歌标准运行的产品。
然而,在没有得到特别关注和支持的情况下,李志飞用了一年多时间,几乎是一个人完成了这个不可能的任务。他几乎重做了一遍系统,保证了离线翻译在不需后台服务器的情况下,在手机上就可以顺畅运行,效果也颇令人惊喜。
可以佐证的是,后来离开谷歌后,仍然有同事告诉李志飞:不少用户留言给谷歌,他们有人在国外突遇灾难或车祸,还有人在以色列、伊拉克等战地遭遇危机,正是离线翻译救了他们的命,使得他们能及时获得救援,方便与医生沟通。这令李志飞颇感欣慰。
在谷歌离线翻译产品落地后,李志飞看到语音识别和自然语言处理在移动上能做出更多创新。比如在生活中,他有这样的亲身经历:下班后太太让买东西回家,沿途虽有超市却并非时时开门,他想通过手机上网查询营业情况,却因为开车驾驶导致操作极为不便。他当时就萌生了开发一个说话就能让手机直接告诉答案的工具。但在人工智能团队,李志飞的部门却没有太多移动上的研究,很多他想要的创新很难实现。
创业是李志飞一直的打算,唯一的问题只不过是什么时候、在哪里开始。现在,这个机会来了。
用前沿技术创造一个商业上成功的公司
事实上,中国市场所蕴含的机会早已让李志飞摩拳擦掌。2011年,智能手机以迅雷不及掩耳之势席卷这个巨大的市场,看看国内苹果商店门口那些日夜蹲守的消费者和黄牛就可以预测到,这里终将有一天会超越美国市场。更重要的原因还有,中国尚缺少真正的技术型公司。在过去,中国诞生了与计算机软硬件相关的明星公司,但真正的技术派尚属稀缺。李志飞特别想做一件事:回到中国,运用一项前沿技术,创造一个商业上成功的公司。“那可能会扭转很多投资者和媒体对这件事的看法。像谷歌那样的公司,用技术改变人类的生活方式,在中国也会有,我就想做这件事。”
基于人工智能领域的语音识别和自然语言理解,李志飞回国迅速创办了科技公司——出门问问。在两年多时间里,他已迈出了重要的三步。
第一步就是从无到有。2013年6月,仅仅用了几个月时间,出门问问就建立了自己的语音识别和自然语言理解系统。当时,苹果推出Siri,谷歌推出Google Now,国内的一些语音公司也纷纷上线语音类应用,试图实现“人机对话”的梦想,其实,这样的梦想背后通常都有大公司和超级团队的支持。而李志飞的团队只有10个人,却不仅做出了语音识别,还开发出一套系统,更诞生了一个供终端用户使用的产品。这样的小团队以及他们的效率在全球都屈指可数。值得一提的是,这套系统还实现了与微信的对接——在当时的微信平台上,出门问问是第一个生活语音搜索引擎,这实现了对产品落地的最真实测试。
像“请问明天最晚一班北京到上海的高铁几点开”这样的问题,在大而全的Siri中,并不能被准确识别和回答。但出门问问则很容易提供精确的生活信息——很显然,在语音识别的准确率上出门问问丝毫不逊于大公司;在用户体验上,则实现了满足用户生活需求的精确定位。
“我们在中国创业公司里应该是唯一一个拥有自己的语音识别、语义分析和应用搜索技术的公司。我们的技术上在国内肯定属于顶尖水平,拿到国际上应该也是一流的。”李志飞并不掩饰自己的自豪。
这个里程碑对李志飞也有两重意义:
第一,以前在谷歌、学校研究室,都是自己一个人搞研究,但是运作一家公司需要集体的智慧和力量。这就需要培养一批人,发挥各自优势,共同分担责任,完成一个艰巨使命。
第二,从投资人的角度看,在当时的市场环境下他们并不理解什么是人工智能,而出门问问实现了从概念到技术的落地,并且得到了市场的积极反馈。这极大地提升了李志飞整个团队的信心。“我一下就觉得,用很少的人也可以做一件伟大的事,只要你拼命往前跑。”
出门问问的第二个重要足迹是在2014年3月。当时李志飞开始考虑和硬件结合,开发Google Glass和Android Wear上的语音搜索。如果说前一年,出门问问实现了技术的应用,那么后面很长一段时间里,整个团队都在探索一些问题:一个真正用户的使用场景是什么?用户为什么用你的产品?你到底解决了什么痛点,而这是别人解决不了的问题?产品能否形成用户黏性?
过去做微信应用、App,只是拿到市场上推广,并没有真正和用户进行零距离的接触。为了了解用户,得到他们的真实反馈和需求,李志飞和团队做了几十场线下活动。Google Glass显然是一个“聪明”的载体和沟通桥梁——这款产品在国内本身就昂贵和稀有,会操作的人更少之又少。比如,在GMIC(全球移动互联网大会)活动上,拥有20个Google Glass的出门问问瞬间成为全场最火的展台。他们帮助用户试用眼镜,并为他们安装软件,教他们如何与机器对话。这时李志飞才发现,原来智能穿戴产品离普通用户的距离还非常远。比如,用户不知如何使用语音来操作智能装备。即使教他们“OK glass”(谷歌眼镜的启动口令)、“Take a picture”(拍一张照片)这样的命令,但是当很多人真的戴在身上后也会有点不知所措。“原来很多东西在你看来很自然,或许你对AI(人工智能)技术已习以为常,但是在用户那里,会遇到很多问题。”
这样的经历让李志飞完成了一个从技术到产品的思想上的转变,开始考虑产品应该如何落地,是不是能真正实现自己的最终目标:做出一个用户每天都能用的,并且有商业前景的产品。
第三步,也是最重要的里程碑,则是Ticwear刷表系统的发布。由于谷歌在中国的限制问题,Android Wear在国内水土不服,用户无法在摩托罗拉的Moto 360、三星Gear、LG的G Watch等产品中正常使用Android Wear上原生的便利功能。出门问问因此开发了一套基于Moto 360的中文操作系统,来填补Android智能手表在中国的空白。这件事对出门问问来说,能力上一下子增强了很多。早在2014年6月,要做这个ROM(手机系统固件)时,李志飞心里有点没底——他擅长的是做与算法、人工智能相关的产品,但ROM却从没开发过,也没接触过这个圈子;谁能做这件事情,他也没有判断能力。然而在半年后的12月,出门问问却基于Moto 360手表开发出一整套操作系统Ticwear,并且得到媒体的正面评价。“那种感觉,就跟2013年6月做出第一个产品时是一样的。”而且,李志飞这次的体验更深刻,因为无论出门问问的知名度,还是各方面能力都有了很大提升,已经离他的梦想越来越近。“我们先做了技术,用微信账号作尝试;再到Google Glass平台,不断改善用户体验;然后做了系统层次,让手表变得特别简单,用户划一下,或者直接说‘你好,问问’,就可以应用了。这离我想象的那种真正完整的体验,或者对用户来说特别方便、带来效率、带来价值的方式已经越来越近了。”智能硬件的飞速发展使李志飞的梦想得以插上翅膀。如果说2007年iPhone的出现,在重新定义手机的同时也定义了移动互联网;那么2012年Google Glass的出现,则将可穿戴设备带入了消费者视野,智能穿戴从概念化时代进入了产品化时代。就拿国内市场来说,自2013年以来,投资圈对智能硬件市场青睐有加。截至2014年12月15日,在智能可穿戴、智能医疗、智能家居等领域有68笔资金注入,共有58家新兴中国智能硬件公司获得融资,融资总额约5亿美元。
然而智能硬件的普及也是一个巨大的工程,正因如此,从系统层面的推广具有重要意义。一个全新人工智能概念,涉及硬件、软件、消费者的认知,甚至耗电量这样的细节,各方面都需要经过很多考验。出门问问开发的操作系统,对国内绝大部分公司,或者说90%以上的团队来说都颇有难度;而从全球看,即使三星、摩托罗拉,也依赖于谷歌的操作系统,可见做语音搜索颇为不易。“所以我们会推动这个东西,不仅因为我们把它推到了操作系统这个层次,而且因为语音搜索的问题解决了,只要再把硬件做好,得到消费者认知,这个想法就会实现。”
为了得到真实反馈,李志飞尝试更接地气地去了解用户。他每天挂在QQ群里,真的发现了一些过去不能理解的现象:比如用户们喜欢天天换表盘。作为一个从事系统工程开发的科学家,他并不能理解换表盘这件事情有多大的意义,后来才慢慢发现,原来年轻人是很关注这些炫酷的东西的。这就让他开始考虑如何加上这些令用户愉悦的小细节。此外,虽然智能硬件中英文的操控多是一些简单的单词,李志飞过去也没有意识到系统汉化会如此重要,但到粉丝群里一看,原来很多用户真的会被英文难倒,比如更换电池,或者向左向右滑动的指示,一旦用户不能确定,他就会感到紧张,怕不小心删掉东西或重启,从而不再愿意尝试,就此产生了与产品的距离。“我们发现,做一个真正的产品,一些最基本的功能在消费者体验中真的非常重要,解决了这些问题才是通向人工智能的第一步。”这给了李志飞很重要的启发,他甚至觉得自己关注到了一些谷歌也没有想到的问题。“我想谷歌从功能上绝对没有涉及这些,因为他们还离用户很远。”
保持与硅谷连线
对出门问问来说,公司技术本身就与谷歌很有相似性,而且作为一家高科技公司,一定要保证技术在全世界领先,这就让李志飞随时要关注全球最新的产品动向。离开谷歌后,他仍然与硅谷保持着密切联系。他会经常跑到斯坦福大学等高校参加语音识别、自然语言理解以及Android Wear的学术会议,也会邀请谷歌或者一些朋友来出门问问做分享,陪他们在中国游玩,跟他们保持密切的联系,从而获得第一手的技术讯息。
谷歌的工作经历也留给李志飞和出门问问很深的印记。比如,首先,谷歌是一家技术主导的公司,很多时候它的产品都是用一个强大的技术去支撑,或者说把已有的产品,比如email形态化,变成最适合用户的产品。李志飞想做的,正是以最尖端的技术来驱动整个公司。
第二,开发工具的重要性。这一点,几乎成为出门问问超越所有同类型公司的“必杀技”。比如,自然语言处理支持很多垂直内容,原则上每个垂直内容都要做一套语义分析系统和导航,一般公司的做法是,针对每一个内容,专门有对应的工程师来完成这件事。这种方式在刚开始时进展最快,因为它把职责明确化。但在开发过程中,“人”往往成为最大变数,一旦工程师离开,就会对工程进度造成影响。