未来三十年,我们将去向哪里?
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一节 什么是人工智能

让我们先来读一首以“人工智能”为主题的现代诗。

智能革命,畅游天地,我知道这是一条神经虚拟网络的秘密,用强健的身体,凝聚着智慧的心灵,开拓新奇迹,让我们拥有美好的生活,绘出美好的旋律。

不可预测的天地,良夜之后你又会在哪里。温暖的阳光照耀着大地,天上的云儿飘来飘去,醒来之后何时是归期。我要看到未来的自己。[1]

如果用中文普通话的发音朗读,你可能对诗作的艺术水准有更直观的感受。或许你会认为这首诗写得不错,又或者认为它写得有些生硬。你或许读到了其中的一些典故,也可能认为它与我们即将讨论的主题“人工智能”没有太多关系。

事实上,这段诗作节选自百度公司开发的人工智能系统——百度大脑所创作的作品,并且没有经过人为润色。百度大脑在作诗之前曾经进行过“学习”和“训练”,如同人类一样。而它最终创作出的作品,还取决于它自身的“算法”。

那么像百度大脑这样的人工智能系统是怎么运作的,它现在能做什么,不能做什么?人工智能现在是什么样的,未来它会变成什么样?人工智能会对我们人类造成哪些影响?这些是我们在下文中将要回答的问题。

一、如何认识和理解人工智能

人工智能自1956年诞生以来,人工智能的理论和技术日益成熟,应用领域也不断扩展,人工智能逐渐成为了一门极富挑战性的前沿科学。人工智能在未来将可能对人的意识、思维的信息过程进行模拟,达到像人那样思考、甚至超过人的智能程度。

作为一门多学科交叉的前沿科学,人工智能涉及的知识领域包括计算机、医学、心理学和哲学,并由不同的领域组成,如机器学习、计算机视觉等。通俗地讲,人工智能研究的一个目标是让机器能够胜任通常需要人类才能完成的、甚至一些当前人类不能完成的复杂工作。

尽管“人工智能”已经成为一个社会上十分流行的概念,但对人工智能的定义还没有达成共识。传统人工智能遵循的发展路径是首先通过研究人类如何产生智能,然后让机器学习人的思考方式去还原行为。关于什么是“智能”,这涉及诸如意识(CONSCIOUSNESS)、自我(SELF)、思维(MIND)(包括无意识的思维,UNCONSCIOUS_MIND)等问题。其实人类对自身智能的理解还非常有限,包括人的智能的必要元素,因此很难准确定义什么是“人工”制造的“智能”。一些人工智能涉及对人类智能本身的研究,代表性研究是脑科学和类脑科学。

现代人工智能概念的提出者美国科学家约翰·麦卡锡认为,我们不一定要求机器能够像人一样思考,如何让机器能够解决人脑所能解决的问题才是重点。在这条主线下,机器学习的概念开始诞生并不断发展。以深度神经网络为代表的机器学习利用具体的算法指导计算系统利用已知数据得出适当模型,并利用此模型对新的情境进行判断,从而完成行为机制过程。目前脑科学和类脑科学研究进展有限,而机器学习发展迅速,已经成为当今人工智能技术的代表性技术,人们甚至常常把“人工智能”与“机器学习”两个概念等同起来。[2]

专栏2-1 AlphaGo的人工智能系统

围棋是中国发明的棋类游戏,西方称为“Go”,其棋盘上共有361个交叉点,如图2-1所示。衡量围棋游戏复杂度的两个指标分别是状态空间复杂度和博弈树复杂度。其中状态空间复杂度指的是棋子在棋盘上摆法的种类——黑白棋子在棋盘上的摆法达到2.08×10170种;博弈树复杂度指的是围棋对弈的总可能性,达到约10300种。谷歌科学家宣称,AlphaGo最终版的对弈数量为2.9×107种,尽管已经远远超越了人类棋手,但相比10300的总数来看,还远称不上对围棋的各种可能性“穷尽式”分析。

AlphaGo系统解决自身计算能力问题的方法是“推理+训练”。采用四大核心技术——简化决策论模型、蒙特卡洛树搜索、深层神经网络(残差网络)、强化学习——进行了2 900万局的自我对弈。

图2-1 围棋棋盘示意

二、人工智能的发展历程

目前,按照人工智能的智力水平,可以将其分成三大类。

弱人工智能(Artificial Narrow Intelligence,ANI):弱人工智能是擅长于单个方面的人工智能。例如,阿尔法围棋(AlphaGo)虽然能够战胜围棋世界冠军,但是除了下围棋之外并没有其他的功能。

强人工智能(Artificial General Intelligence,AGI):强人工智能是人类级别的人工智能,只要是人类能干的脑力活动它都能胜任,而且比人类在容量、存储空间、可靠性、持久性、可编辑性、升级性以及更多的性能等方面更具优势。

超人工智能(Artificial Super Intelligence,ASI):牛津大学哲学家、知名人工智能思想家尼克·博斯特罗姆将超级智能定义为:“在几乎所有领域都比最聪明的人类聪明,包括科学创新、通识和社交技能。”超人工智能有可能在各方面仅比人类强一点,也有可能是在各方面比人类强万亿倍。

人工智能还可以按照应用性进行划分。按照中国科学院谭铁牛院士提出的分类标准,专用人工智能系统是面向特定任务的,因为系统具有任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单等特点,形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能,这和弱人工智能的概念重合度比较大。通用型人工智能则需要具备人脑一样的“举一反三”的能力,与强人工智能的概念重合度较大,目前人工智能技术的发展还达不到这一要求。

人工智能发展的初期,科学家对让计算机自己学会逻辑推理寄予厚望。1956年的“达特茅斯会议”上,美国科学家艾伦·纽厄尔和赫伯特·西蒙展示了可以通过物理符号系统推导数学公式的样机“逻辑理论家”,并成功证明了由英国数学家怀特海德和罗素编写的《数学原理》一书中52个定理中的38个。此后20世纪60年代中期,麻省理工学院的约瑟夫·维森鲍姆编写了第一个自然语言对话程序Eliza,引起轰动。但在后期发展中,这种符号主义式的方法遇到了诸多瓶颈,例如只能证明已知定理,不能发现新定理[3]

专栏2-2 赫伯特·西蒙的传奇故事

赫伯特·西蒙(下图)因制作“逻辑理论家”并参加达特茅斯会议,被认为是人工智能的奠基者之一。1975年,西蒙与纽厄尔因在人工智能领域的开创性贡献获得了计算机科学的顶级荣誉——图灵奖。不仅如此,西蒙在心理学、管理学、经济学和认知科学方面也有突出贡献。1978年,西蒙凭借“对经济组织内的决策过程进行的开创性研究”荣获诺贝尔经济学奖,成为少有的获得两个以上科学领域顶级奖项的科学家。

20世纪80年代,人们开始致力于专家系统的构建。专家系统,顾名思义,是具备类似人类行业专家能力的软件,在特定领域根据编写的规则回答问题。具有代表性的专家系统包括卡内基梅隆大学为DEC公司编写的专家系统XCON(主要用于组合计算机配件)和麻省理工学院牵头编写的过程工业专家系统ASPEN PLUS(主要用于计算石化等化工生产的过程数据)等。

同时期,对今天人工智能发展有巨大影响的人工神经网络研究也取得了重要进展,该项研究成为了如今许多人工智能算法的基础。1986年,杰弗里·辛顿等科学家发表了论文,展示了反向传播算法。该算法可以通过神经网络的隐藏层进行有效的学习。与此同时,日本通产省开启了旨在建造超级计算机,支撑人工智能发展的“第五代计算机”项目,投入巨资,结果却不尽人意。

从20世纪80年代至今,随着越来越多数学模型和算法的发展(例如统计机器学习、支持向量机等),人工智能领域越发细分,解决了很多实际问题。与此同时,硬件科学家和工程师们不断开发更强的工具,相继将中央处理器(CPU)、图形处理器(GPU)用于人工智能计算,并已经开始开发新一代专用集成电路(ASIC和FPGA)芯片用于人工智能计算和加速。这引发了人工智能的又一次热潮。在这次热潮中,工程师们用已经发展成熟的硬件和算法,解决特定问题(例如弱人工智能问题),取得了超越人类的效果。

可预见的未来,人类仍将为发展通用性的强人工智能而不断努力,而这一次我们的知识和经验储备比以往更加丰富。

三、人工智能技术在各行业中的应用

随着算法、计算能力的不断提升和演进,基于语音、自然语言处理和视觉技术有非常多的应用和产品落地。比较典型的有语音交互类产品(如智能音箱、智能语音助理、智能车载系统等)、智能机器人、无人机、自动驾驶汽车等。在行业解决方案方面,人工智能的应用范围更加广泛,目前已经在医疗健康、金融、教育、安防、商业、智能家居等多个垂直领域得到应用。

(一)常见的人工智能终端产品和行业应用

(1)智能音箱。

智能音箱不仅可以进行网络交互,还可以使用户对家居设备进行智能化控制。智能音箱是搭载了人工智能语音交互系统的联网式音箱。智能音箱近几年的年均复合增长率超过30%。预计,智能音箱全球总市场规模将从2017年的11.5亿美元增至2021年的35.2亿美元,将会超过普通的音箱市场。全球智能音箱市场主流产品如表2-1所示,天猫精灵智能音箱如图2-2所示。

表2-1 全球智能音箱市场主流产品[4]

图2-2 天猫精灵智能音箱

(2)智能机器人。

智能机器人的关键技术包括视觉、传感、人机交互和机电一体化等。从应用角度分,智能机器人可以分为工业机器人和服务机器人。其中,工业机器人一般包括搬运机器人、码垛机器人、喷涂机器人和协作机器人等。服务机器人可以分为行业应用机器人和个人/家用机器人,行业应用机器人包括智能客服、医疗机器人、物流机器人、引领和迎宾机器人等;个人/家用机器人包括个人虚拟助理机器人、家庭作业机器人(例如扫地机器人)、教育儿童机器人、看护老人机器人和情感陪伴机器人等。

优必选(UBTECH)公司是中国领先的智能机器人企业之一。该公司的产品“悟空”机器人集成了很多功能,包括图像识别、语音识别、机器翻译、人机交互、语音合成等。借助这些功能,“悟空”机器人可以实现多种简单功能,例如幼儿教学、英语翻译、简单聊天等,如图2-3所示。

图2-3 “悟空”机器人的智能功能

根据国际机器人联合会(International Federation of Robotics,IFR)2019年9月发布的数据,2018年全球销售额为165亿美元,这是根据各国机器人协会报告的预测数值。这个数值仅包括机器人,如果再把软件、外围设备和系统工程包括进去,这个数值约为500亿美元。2018年全球装机量为42.2万台比上年增长6%。IFR预测2019年的装机量将较2018年有所回落,但预计从2020年到2022年平均每年增长率可保持12%。目前中国、日本、韩国、美国和德国,前五大工业机器人市场占全球装机量的74%。

工业机器人产业在过去的十年中快速增长。IFR的数据显示,全球工业机器人的供应量从2003年的81 000台猛增至2015年的254 000台。

(3)无人机。

目前,无人机市场主要有个人消费级无人机和商用无人机。目前,个人消费级无人机主要用途是用于航拍、跟拍等场景;而商用无人机的应用范围非常广泛。商用无人机可以用于农林植保、物流、安保、巡防等多个领域。在价格和性能方面,个人消费级无人机售价基本保持在5 000美元以下,续航能力不超过1小时。商用无人机相较于个人无人机而言,拥有更大的有效载荷和更长的飞行时间。目前商用无人机在工业领域应用更为成功。尽管商用无人机的市场出货量相对较小,但因售价较高,其收入占据了无人机市场的三分之二。

以大疆Mavic 2[5]无人机为代表的无人机已经具备诸多智能功能,例如从背景中识别出人物、跟踪移动中的物体并在受到遮挡时自动判断轨迹,甚至能够主动规避障碍物和规划前进路线。这类功能主要通过无人机搭载的智能视觉系统来实现。大疆Mavic 2无人机如图2-4所示。

图2-4 大疆Mavic 2无人机

(4)企业的云助理。

阿里云是全球领先的云计算及人工智能科技公司。阿里云在服务平台上集成了企业级的智能语音交互功能。阿里智能语音交互(Intelligent Speech Interaction)是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融、保险、司法、电商等多个领域均有应用案例。目前阿里云提供的录音文件识别服务价格可以低至0.8元/小时,如表2-2所示。

表2-2 阿里云语音转录的价格[6]

相较于终端产品而言,人工智能相关的行业应用则更为丰富。后续重点介绍人工智能技术在智能医疗、智能金融、智能安防、智能家居和智能电网等领域的行业应用[7]

(二)智能医疗

随着人工智能技术的不断发展,已有不少应用人工智能提高医疗服务水平的成功案例。人工智能已经深入医疗健康领域的方方面面,在智能诊疗、医学影像分析、医学数据管理、健康管理、精准医疗、新药研发等场景中都可以看到人工智能的身影。

在过去,医生通过自己的医疗知识和临床经验为基础,根据病人的症状和检查结果判定病症及病程。而如今,人们将人工智能应用于医疗辅助诊断,让计算机“学习”专业的医疗知识、“记忆”海量历史病例、识别医学影像、构建智能诊疗系统,为医生提供一个“超级助手”,帮助医生诊断。IBM Watson是智能诊疗应用中的一个著名案例。Watson可以在17秒内阅读3 469本医学专著、248 000篇论文、69种治疗方案、61 540次试验数据、106 000份临床报告[8]。腾讯公司开发的“腾讯觅影”AI辅诊平台,已经初步具备如食管癌、肺癌、糖尿病性视网膜病变、乳腺癌、结直肠癌、宫颈癌等疾病的早期筛查能力,其中食管癌、肺癌和糖尿病筛查的准确率都超过了90%,能够有效帮助医生进行诊断。2018年,腾讯觅影成立了国家人工智能医学影像开放平台。

(三)智能金融

智能金融是人工智能技术与金融体系的全面融合。人工智能在金融领域的应用主要包括“智能投顾”和金融欺诈检测等。

“智能投顾”即智能投资顾问,是金融科技中非常常见的一类应用场景。“智能投顾”通过机器学习算法,根据客户设定的收益目标、年龄、收入、当前资产及风险承受能力自动调整金融投资组合,以实现客户的收益目标。不仅如此,算法还能根据客户收益目标的变动和市场行情的变化实时自动调整投资策略,始终围绕客户的收益目标为客户提供最佳的投资组合。目前美国的一些大中型投资公司如Betterment和WealthFront已经通过“智能投顾”为客户提供服务,并且价格低廉,获得了年轻一代的喜爱和认可。

以往金融欺诈检测系统非常依赖复杂和呆板的规则,由于缺乏有效的科技手段,已无法应对日益演进的欺诈模式和欺诈技术。伪造、冒充身份等欺诈事件常有发生,给金融企业和用户造成了很大的经济损失。一些企业开始致力于应用人工智能技术构建自动的、智能的反欺诈技术和系统,通过这些来帮助企业的风控系统打造用户行为追踪与分析能力,建立异常特征的自动识别能力,逐步达到自主、实时的发现新的欺诈模式的目标。

(四)智能安防

安防是人工智能较好的应用领域。智能安防基于海量的图像和视频等数据训练算法和模型,为安防行业事前预警、事中响应和事后处理提供了技术保障。

目前,人工智能在安防领域的应用主要包括警用和民用两个方向。在警用方向,人工智能在公安行业的应用最具有代表性,利用人工智能技术实时分析图像和视频内容,可以识别人员、车辆信息、追踪犯罪嫌疑人,也可以通过视频检索对从海量图片和视频库中对犯罪嫌疑人进行检索比对,为各类案件侦查节省宝贵的时间。在民用方向,利用人工智能可以实现智能楼宇和工业园区的智能监控。智能楼宇包括门禁管理、通过摄像头实现“人脸打卡”、人员进出管理、发现盗窃和违规探访等行为。在工业园区,固定摄像头和巡防机器人配合,可实现对园区内各个场所的实时监控,并对可能潜在的危险进行预警。除此之外,民用安防方向还有一个非常重要的应用场景,就是家用安防。如果检测到家庭中没有人员时,家庭安防摄像机可以自动进入布防模式;有异常时,给予闯入人员声音警告,并远程通知家庭主人。而当家庭成员回家后,又能自动撤防,保护用户隐私。

安防领域作为人工智能成功落地的一个应用,国内很多安防企业也开始从技术、产品等不同角度涉足人工智能。海康威视、大华、东方网力等传统企业在不断加大安防产品的智能化;另外,像商汤科技、旷视科技、云从科技和依图科技等算法见长的企业正将技术重点聚焦于人脸识别、行为分析等图像智能领域。

商汤科技(Sence Time)是中国领先的人工智能系统服务公司。北京大兴国际机场航站楼中布置的四层58条安检通道采用的“智能旅客安检系统”中的人脸识别技术由商汤科技提供。其能够在旅客身份安检过程中,自动快速完成人员、机票和身份证的三合一核验;同时能够在行李安检过程中,进行人脸动态识别,以创建生物特征标签,实现“人包绑定”,保证安检流程可回溯。在机场航站楼之外,地铁新机场线站点的进出站闸机通道也均采用类似的人脸识别系统,持卡工作人员可通过刷脸进出地铁站,如图2-5所示。

图2-5 大兴机场的进出站闸机[9]

(五)智能家居

智能家居基于物联网技术,以住宅为平台,由硬件、软件、云平台构成家居生态圈。智能家居可以为用户提供个性化的生活服务,使家居生活更便捷、舒适和安全。

例如,借助语音和自然语言处理技术,用户通过说话即可实现对智能家居产品的控制,如语音控制开关窗帘(窗户)、照明系统、调节音量、切换电视节目等操作;借助机器学习和深度学习技术,智能电视、智能音箱等可以根据用户订阅或者收看的历史数据对用户进行画像,并将用户可能感兴趣的内容推荐给用户。在家居安防方面,可以利用面部识别、指纹识别等生物识别技术对智能家居产品进行解锁,通过智能摄像头实时监控住宅安全,对住宅非法入侵进行监测等。

在国内,小米打造的智能家居生态链在经历了几年的积累后,已经形成了一套自研、自产、自销的完整体系,接入生态链的硬件已经高达6 000万台。另外,以美的、海尔、格力为代表的传统家电企业依托本身庞大的产品线及市场占有率,也在积极向智能家居转型,推进自己的智能战略。

(六)智能电网

随着电网规模的扩大,人工智能已成为智能电网越来越重要的部分。人工智能技术能持续监控家庭和企业的智能电表和传感器的供需情况,实时调整电网的电力流量,实现电网的可靠、安全、经济、高效。

人工智能技术可以协助电力网络运营商或者政府改变能源组合,调整化石能源使用量,以及增加可再生能源的产量。在线路的巡视、巡检方面,借助智能巡检机器人和无人机实现规模化、智能化作业,提高效率和安全性,如图2-6所示。据广东电网的资料显示,广东电网在变电站的机巡年作业量超18万千米,相当于绕地球4.5圈,其中无人机巡视占85%,作业量全球第一,综合效率提升了2.6倍。

图2-6 巡检机器人用激光雷达拍摄的线路[10]