第三节 发展特点
当前,全球主流深度学习框架纷纷开源,其中以TensorFlow、Caffe、Keras等最受开发者欢迎,全球科技巨头是布局深度学习框架开发开源的主要力量,而科研机构、创业公司是深度学习框架研究的主要力量。来自Github的统计数据显示,在关注度(Stars)和优化修改数(Forks)方面,TensorFlow远远超过其他深度学习框架。如表8-1所示为一些当前主流深度学习框架。
表8-1 当前主流深度学习框架
数据来源:CCID赛迪智库,2019年9月。
深度学习框架作为决定人工智能技术、产业、应用的核心环节,是人工智能核心生态圈建立的基础和关键,核心技术缺失将直接影响深度学习框架生态圈关联的深度学习芯片、深度学习系统、深度学习软硬件平台等产业发展。经过多年积累,我国在人工智能若干技术领域已取得重要突破。但在深度学习框架方面,却一直处于跟随阶段,创新引领能力十分有限。全球最受欢迎的深度学习开源框架TensorFlow、Caffe、Caffe2、CNTK、MXNet、Torch、DL4J和Theano等,均由美国科技公司或科研团队开发。其他具有国际影响力的深度学习框架还包括瑞士的超级深度神经网络框架Brainstorm、日本的动态计算图神经网络框架Chainer等。我国深度学习框架的国际战略缺位,表现为严重依赖国外开源框架,阿里巴巴的分布式深度学习框架Pluto是在Caffe的基础上扩展而来的,小米的深度学习平台Cloud-ML则是基于TensorFlow和Kubernetes等框架开发的。我国国内比较知名的深度学习框架仅有百度于2016年8月开源的飞桨(PaddlePaddle),这是国内唯一自主研发、功能完备的中文开源深度学习平台,但由于缺乏资源支持和正面反馈,其在国际开源社区的活跃度一般,国际影响力有限。2019年8月,为扩大影响力,飞桨推出了端侧推理引擎Paddle Lite,旨在推动人工智能应用在端侧更好地落地。该推理引擎在多硬件、多平台及硬件混合调度的支持上更加完备,是飞桨在Paddle Mobile的基础上进行的一次大规模升级迭代。目前,Paddle Lite已经支持了ARM CPU、Mali GPU、Adreno GPU、华为NPU及FPGA等诸多硬件平台,是目前首个支持华为NPU在线编译的深度学习推理框架,通过对底层架构设计的改进,其拓展性和兼容性等方面实现显著提升。
总体而言,作为“智能时代的操作系统”,深度学习框架下接芯片、上承各种应用,起到了承上启下的关键作用,是人工智能领域不可或缺的基础设施。目前,我国的基础研究无法支撑深度学习框架核心技术的研发,特别是对于神经网络模型可用性、稳定性、运行效率等基础问题探索不足。同时,我国尚缺乏对深度学习框架的超前设计和开发,包括跨平台移植、分布式学习、模型模块化等核心部件的研究滞后。再者,我国尚未开发出适用于特定场景的深度学习框架和服务型产品,缺乏对其应用场景的探索。