1.2.4 人工智能
2017年,AlphaGo战胜世界围棋冠军之后,人工智能再次成为人们所关注的热点。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。美国麻省理工学院的尼尔逊教授对人工智能下了这样一个定义:“人工智能是关于知识的学科——怎样表示知识以及怎样获得知识并使用知识的科学。”而另一位美国麻省理工学院的温斯顿教授认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容,即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。
人工智能的技术应用主要包括自然语言处理(包括语音和语义识别、自动翻译)、计算机视觉(图像识别)、知识表示、自动推理(包括规划和决策)、机器学习和机器人学等。
人工智能的发展需要一定的先决条件:
(1)物联网
物联网提供了计算机感知和控制物理世界的接口和手段,它们负责采集数据、记忆、分析、传送数据、交互、控制等。摄像头和相机记录了关于世界的大量的图像和视频,麦克风记录语音和声音,各种传感器将它们感受到的世界数字化,等等。这些传感器,就如同人类的五官,是智能系统的数据输入,感知世界的方式。而大量智能设备的出现则进一步加速了传感器领域的繁荣,这些延伸向真实世界各个领域的触角是机器感知世界的基础,而感知则是智能实现的前提之一。
(2)大规模并行计算
人脑中有数百甚至上千亿个神经元,每个神经元都通过成千上万个突触与其他神经元相连,形成了非常复杂和庞大的神经网络,以分布和并发的方式传递信号。这种超大规模的并行计算结构使得人脑远超计算机,成为世界上最强大的信息处理系统。近年来,基于GPU(图形处理器)的大规模并行计算异军突起,拥有远超CPU的并行计算能力。
从处理器的计算方式来看,CPU计算使用基于X86指令集的串行架构,适合尽可能快地完成一个计算任务。GPU诞生之初是为了处理3D图像中的上百万个像素图像,拥有更多的内核去处理更多的计算任务。因此,GPU天生具备了执行大规模并行计算的能力。云计算的出现、GPU的大规模应用使得集中化的数据计算处理能力变得前所未有的强大。
(3)大数据
根据统计,2015年全球产生的数据总量达到了十年前的20多倍,海量的数据为人工智能的学习和发展提供了非常好的基础。机器学习是人工智能的基础,而数据和以往的经验就是人工智能学习的书本,以此优化计算机的处理性能。
(4)深度学习算法
这是人工智能进步最重要的条件,也是当前人工智能最先进、应用最广泛的核心技术,又称深度神经网络(深度学习算法)。2006年,Geoffrey Hinton教授发表的论文《A Fast Learning Algorithm For Deep Belief Nets》。他在此文中提出的深层神经网络逐层训练的高效算法,让当时计算条件下的神经网络模型训练成为了可能,同时通过深度神经网络模型得到的优异的实验结果让人们开始重新关注人工智能。之后,深度神经网络模型成为了人工智能领域的重要前沿阵地,深度学习算法模型也经历了一个快速迭代的周期,Deep Belief Network、SparseCoding、Recursive Neural Network,Convolutional Neural Network等各种新的算法模型被不断提出,而其中的卷积神经网络(Convolutional Neural Network,CNN)更是成为图像识别最炙手可热的算法模型。
从2013年开始,科技巨头加大了对人工智能的自主研发,同时通过不断开源,试图建立自己的人工智能生态系统,开源力度不断增加。例如,Google开源TensorFlow后,Facebook、百度和微软等都加快了开源脚步。最早走向人工智能工具开源的是社交巨头Facebook,于2016年1月宣布开源多款深度学习人工智能工具。而谷歌、IBM和微软几乎同时于2016年11月宣布开源。谷歌发布了新的机器学习平台TensorFlow,所有用户都能够利用这一强大的机器学习平台进行研究,被称为人工智能界的Android。IBM则宣布通过Apache软件基金会免费为外部程序员提供System ML人工智能工具的源代码。微软则开源了分布式机器学习工具包DMTK,能够在较小的集群上以较高的效率完成大规模数据模型的训练,微软在2017年7月又推出了开源的Project Malmo项目,用于人工智能的训练。
人工智能已经逐渐建立起自己的生态格局,由于科技巨头的一系列布局和各种平台的开源,人工智能的准入门槛逐渐降低。未来几年之内,专业领域的智能化应用将是人工智能主要的发展方向。无论是在专业领域还是通用领域,人工智能的企业布局都将围绕着基础层、技术层和应用层三个层次的基本架构。
基础层就如同大树的根基,提供基础资源支持,由运算平台和数据工厂组成。中间层为技术层,通过不同类型的算法建立模型,形成有效的可供应用的技术,如同树干连接底层的数据层和顶层的应用层。应用层利用输出的人工智能技术为用户提供具体的服务和产品。
位于基础层的企业一般是典型的IT巨头,拥有芯片级的计算能力,通过部署大规模GPU和CPU并行计算构成云计算平台,解决人工智能所需要的超强运算能力和存储需求,初创公司无法进入。技术层的算法可以拉开人工智能公司和非人工智能公司的差距,但是巨头的逐步开源使算法的重要程度不断降低。应用层是人工智能初创企业最好的机遇,可以选择合理的商业模式,避开巨头的航路,更容易实现成功。