PyTorch神经网络实战:移动端图像处理
上QQ阅读APP看书,第一时间看更新

1.1 人工智能简介

1.1.1 人工智能的概念

人工智能的核心是构造具备智能的人工系统。其中“人工”的含义是指系统是人为制造的,但“智能”的概念则不太容易概括,这是因为人类对自身的智能缺少深刻的理解,尚未对组成智能的必要元素形成定论。因此人工智能通常被概括为模仿人类与人类思维相关的认知功能的机器。它已经发展成一个以计算机科学为基础的交叉学科,是当今热门的研究领域。

构建通用型的强人工智能是人类的长远目标,而现阶段的主流研究方向是弱人工智能。在实现特定功能的弱人工智能上,人类已经取得了不少成果,比如在一些图像识别任务以及棋类游戏上,机器的表现已经超过了人类。人工智能的热门研究方向如图1.1所示,本书主要涉及的是计算机视觉。

·图1.1 人工智能的热门研究方向

1.1.2 人工智能的历史

人类很早就开始探索如何让机器像人一样思考,目前人工智能经历了四次发展和两次低谷的阶段,如图1.2所示。图灵1950年在其所写论文“Computing machinery and intelligence[1](即《计算机器与智能》)中提出,如果一台机器能够通过电传设备与人类展开对话而不被人类辨别出其机器身份,那么可以称这台机器具有智能。这就是大名鼎鼎的图灵测试。但人工智能这一概念真正诞生,则是在六年后的达特茅斯会议上。此项目名为“达特茅斯夏季人工智能研究计划”,该项目提案中涉及了人工智能方面的一些重要问题,例如自动机、神经网络、机器自我进化、如何使用语言对计算机进行编程等概念,这次讨论持续了两个月之久。因此,20世纪40~50年代也被认为是人工智能概念的诞生阶段。

·图1.2 人工智能的发展历史

之后的十几年时间是人工智能的第一个发展期,出现了一批研究成果,比如美国斯坦福国际研究所研究出世界上第一台真正意义上的移动机器人Shakey。Shakey能够解决简单的感知、运动规划和控制问题,是当时将人工智能应用于机器人的最为成功的研究成果;世界上第一个真正意义上的聊天机器人Eliza也诞生于这个时期,它能够通过脚本理解简单的自然语言,产生类似人类的互动。同时计算机也被应用在数学定理证明上。这让当时的研究者很兴奋,甚至乐观地估计20年内,机器就能替代人来完成工作。美国国防部高级研究计划局等政府组织也向人工智能这一领域投入了大笔资金,这段时间被认为是人工智能的起步发展期。

但20世纪60年代末,人工智能进入了低谷期。当时的计算机受限于内存和计算能力,几乎无法解决任何复杂的人工智能问题。当人们开始尝试更具挑战性的任务时,发现很难取得突破。同时科研人员对于问题困难程度的错误预估也导致了和美国国防部高级研究计划局的合作计划以失败告终。这段时间,人工智能的研究都缺少实质性的进展,外界的批评声也开始压向学术界。英国政府、美国国防部高级研究计划局和美国国家科学委员会都逐渐停止了对方向不明确的人工智能研究的资助,人工智能的发展进入第一次低谷期。

20世纪70年代末到80年代初,人们找到了人工智能的实际应用价值,一批专家系统开始服务于企业界。专家系统是一类计算机智能程序,它具有专门领域内的知识和经验,能结合逻辑规则来解决特定领域的问题。因为专家系统侧重于从一般推理策略转向为某个具体领域内的决策,所以设计与实现相对简单,并且具有实用性,所以受到了追捧。1981年,日本拨款8.5亿美元用以研发第五代计算机项目,该项目希望制造出具有推理、联想和学习能力的计算机,让人类能够通过自然语言、图像、声音等各种手段与计算机进行交互。这引起了当时世界各国的关注,英国、美国也纷纷响应。因此人工智能的研究再次得到资金支持,迈入了应用发展期。

但不久后的20世纪80年代中期到90年代中期,人们发现专家系统应用领域太窄,它的实用性仅仅局限于特定场景,存在缺乏常识性知识、知识获取困难、推理方法单一等问题。到了20世纪80年代晚期,美国国防部高级研究计划局也不再认为人工智能会是下一次浪潮,政府投入缩减。日本第五代计算机项目计划也宣告失败,人工智能进入了第二次低谷期。

20世纪90年代晚期到2010年,互联网技术和硬件计算能力的快速发展,推动了人工智能的研究,加快了技术落地。标志性事件是1997年IBM的深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,让世界为之震惊。2006年,“神经网络之父”Geoffrey Hinton开创了无监督、分层预训练多层神经网络的先河,这一年被视为深度学习元年。这段时期被视为人工智能的稳步发展期。

2010年至今是人工智能的快速发展期。随着大数据、云计算、互联网和物联网等技术的进步,以及图形处理器算力的推动,以深度神经网络为代表的人工智能技术得到飞速发展。2012年,Hiton和学生Alex Krizhevsky设计的卷积神经网络模型AlexNet获得2012年ImageNet竞赛冠军,且表现远超第二名,因此卷积神经网络乃至深度学习引起了学术界的广泛关注。2016年3月,谷歌公司旗下DeepMind公司开发的AlphaGo以4:1的比分战胜围棋世界冠军李世石,(因为围棋问题非常困难)这一成果震撼了整个世界。世界各国纷纷出台了国家级行业发展推动政策,深度学习迅速成为学术界和工业界的宠儿。如今,各类深度学习技术已经“飞入寻常百姓家”,实实在在地改变了人类的生活。

1.1.3 人工智能与深度学习的关系

从人工智能的定义和历史发展来看,它已经成为一门内容广泛的学科。因此在书面和日常交流中,也常常存在混用人工智能、机器学习和深度学习等概念的情况,实际上这三者范围是依次递减的,如图1.3所示。

·图1.3 人工智能机器学习与深度学习三者关系

机器学习是人工智能的一个分支,它能够从数据中自动分析获得规律,对未知数据进行预测。而人工神经网络则是人类模仿生物神经网络的结构和功能提出的一种计算模型,属于机器学习算法中的一种。机器学习算法除了人工神经网络外,还包括决策树、支持向量机、聚类以及降维算法等。早期阶段,反向传播算法给人工神经网络的发展带来一轮热潮,但受客观因素限制,当时的网络大都属于浅层模型。现阶段的深度学习则强调神经网络的深度,自2012年AlexNet获得ImageNet挑战赛的冠军后,深度学习就成为当下炙手可热的机器学习算法,驱动着新一轮人工智能技术的发展。

1.1.4 深度学习的应用

深度学习在过去的短短十几年间已经从学术界进入人们的日常生活,如图1.4所示。在语言文字方面,以深度学习技术为核心的语音识别、语音合成、语言翻译、文本理解、文字识别已经被成功应用于各类软件上,降低了跨语言沟通的成本,为听障以及视障人群带来更多便利;在视觉方面,人脸识别、目标检测、目标检索、图像分割、医疗图像识别、工业图像识别已经成为驱动智慧城市、智慧安防、智慧医疗、智慧工厂以及自动驾驶的重要力量;此外,智能美颜、个性化推荐、图像迁移与超分辨率重建也给人们的娱乐生活带来更好的体验。本书的后续章节将以部分实际应用为例,分析其基本原理并使用简洁的代码实现这些神奇的算法。

·图1.4 目前深度学习成功应用的领域