前言
本书是国家社科基金重大项目“云计算环境下的信息资源集成与服务研究”(项目编号:12 & ZD220)的代表性成果之一。自2012年12月立项以来,课题组在全国哲学社会科学规划办公室和中国人民大学的领导和支持下,圆满完成了全部拟定任务,并在云计算环境下信息资源的系统架构、存储策略、组织方法、集成方法和服务模式等方面展开了一系列开创性的研究工作。本书介绍了课题组的部分研究工作,尤其是云计算环境下的信息资源集成方法和服务模式方面的较为系统性的研究发现。
本书由课题首席专家杜小勇和卢小宾共同策划与设计,杜小勇、卢小宾、朝乐门、何军、郭晶以及课题组全体成员共同完成具体研究工作,最终由朝乐门、杜小勇和卢小宾负责完成了全书的统稿和审校工作。全书分为8章,各章的主要内容及创新性工作如下:
第1章为相关工作。根据国家社科基金重大项目“云计算环境下的信息资源集成与服务研究”的研究设计,对国内外相关研究进行了较为系统的调查分析,并提出了现阶段的研究进展和主要挑战。本章的研究工作主要从以下3个方面开展:①信息资源集成,尤其是云计算环境下的信息资源集成相关研究的主要进展;②信息资源服务,尤其是云计算环境下的信息资源服务相关研究的主要进展;③云计算环境下的信息资源集成与服务相关研究所面临的主要挑战。本章的主要执笔人为朝乐门、王建亚、杨灿军、刘岩和王雨晴。
第2章为顶层设计。在梳理主流的云计算技术的发展现状与趋势的基础上,深入探讨了云计算环境下的信息资源集成与服务基础平台的设计需求,并深入探讨了其设计目的、基本流程、总体框架和关键技术。本章提出的云计算环境下的信息资源集成与服务基础平台的主要创新点在于:①定义了信息资源的碎片化利用及碎片信息资源的集成与服务的基本流程;②提出了一种面向云计算环境下信息资源的弹性集成与服务的数据模型——iRDD(Information Resource Resilient Distributed Datasets);③给出了一种云计算环境下信息资源集成与服务的统一的顶层框架体系;④采用广义信息资源的概念,引入了人机协同的信息处理模式;⑤提出了面向云计算环境下信息资源管理的数据连续性保障方法;⑥提出了碎片信息资源的数据对象的语义建模方法。本章的主要执笔人是杜小勇和朝乐门。
第3章为集成方法。在梳理国内外相关研究的基础上,结合课题研究目标,提出了云计算环境下的信息资源的集成方法,并探讨了其基本特征、主要类型及关键技术。本章提出的云计算环境下的信息资源集成方法的主要创新点在于:①从资源、碎片、标签等3个不同层次提出了云计算环境下的信息资源集成方法;②本章提出的集成方法具有弹性集成和惰性计算的特点,不仅避免了中间iRDD的数据的I/O成本,而且确保了信息资源集成活动中的数据一致性;③提出了一种数据驱动型信息资源的集成方法,改变了传统的目标驱动和模型驱动的信息资源集成方法;④提出了信息资源集成与服务中的结果呈现方法——数据可视化和故事化描述。本章的主要执笔人为朝乐门和杜小勇。
第4章为集成技术。在深入分析云计算环境下的信息资源集成的底层技术的基础上,探讨了面向云计算环境的信息资源集成的形式化表示技术,并提出了一种碎片信息资源的集成方法。此外,本章还提出了针对云计算环境下信息资源集成的参考框架体系,并探讨了其中的若干关键性技术问题,如故障/慢节点的处理、存储级别的选择等。本章的主要创新性工作如下:①提出了一种面向碎片化信息资源的数据模型——iRDD的形式化表示方法;②提出了一种将碎片信息资源iRDD集成为数据对象的算法,并探讨了碎片的集成策略、选择最佳目标信息资源个数的方法及同一个信息单元中的碎片对象的排序方法;③提出了一种基于Spark的信息资源碎片化利用和集成的技术参考模型,并分别从流程、计算、存储和服务4个层面探讨了其实现细节。本章的主要执笔人为朝乐门、杜小勇和杨灿军。
第5章为服务模式。以用户信息行为理论、信息技术采纳理论、创新扩散理论以及可信计算理论为基础,重点探讨了政务网络可信云服务管理模式、商业数据分析模式与科研知识挖掘模型等云计算环境下信息资源服务模式的核心问题,提出了相应的解决方案。本章的主要创新性工作如下:①探讨了用户信息行为、信息技术采纳、创新扩散以及可信计算等云计算环境下信息资源服务模式构建的理论问题;②论述了云服务背景下政务网络生态失衡的成因、表现特征,提出了云计算环境下构建政务网络信息生态服务管理模式的3个维度:业务质量、数据管理和权益保障;③分析了云计算环境下商业数据分析模式的3个主要技术层次:数据存储、数据处理和数据组织与管理,从理论角度提出了Google三大云计算技术——GFS、MapReduce和Bigtable对于海量商业数据的分析模式;④从需求分析、资源建设、人员培养、技术选择和制度建设等方面研究了云计算环境下科研知识挖掘的影响要素,构建了科研知识挖掘要素关系框架模型。本章的主要执笔人为王涛、卢小宾、官思发、霍亮和童楠楠。
第6章为服务采纳。在深入探讨个人用户和企业用户云服务采纳行为理论的基础上,系统分析了个人用户和企业用户云服务采纳行为的影响因素,构建了云计算环境下个人用户和企业用户的信息资源服务采纳模型。本章的主要创新性工作如下:①以信念-态度-行为理论、技术接受模型、网络外部性理论、信任理论、创新扩散理论为理论基础,分析了个人云存储采纳行为的影响因素,构建了个人云存储的采纳模型;②以传统技术采纳理论背景下企业信息化阶段发展特征为基础,结合云服务采纳的技术特殊性,提出了云服务采纳背景下企业信息化阶段发展特征;③以企业资源观、企业信息化阶段理论、组织技术采纳理论为理论基础,从采纳主体、客体、环境和中介4个方面梳理了企业云服务采纳的影响因素,构建了企业云服务采纳模式。本章的主要执笔人为卢小宾、王涛和王建亚。
第7章为典型系统。主要介绍了两种典型的云计算环境下的信息资源集成与服务平台——新闻热点事件的发现与跟踪系统和法学学科资源服务平台。在平台构建的过程中,课题组针对云计算环境下信息资源集成与服务所面临的诸多问题提出了多种解决方案,相关的研究成果已分别发表在高水平的国际期刊Decision Support Systems、Information Systems上,获得WISE2013国际会议Best Challenge Paper Award,并申请了多项国家发明专利。本章的主要创新性工作如下:①结合两种典型系统的研发需要,分别讨论了云计算环境下信息资源集成和服务的关键技术;②提出了一种云计算环境下的信息资源集成和服务平台的通用架构;③研发新闻热点事件的发现与跟踪系统,并给出了其关键技术和新闻正文自动化抽取算法流程;④研发法学学科资源服务平台,并提出了其信息资源集成策略和服务类型。本章的主要执笔人为何军。
第8章为示范应用。以上海交通大学图书馆思源探索资源发现系统为例,分析并剖析图书馆的这种新型服务模式,可实现个性化、可定制、主动服务的目标,以示范应用为基础,为云计算环境下的信息资源集成服务给出一套完整的应用评价体系和应用模式推荐。本章的主要执笔人为郭晶和陈嘉懿。
考虑到整体性及篇幅,本书并未涵盖课题组的全部创新性工作。课题研究是一项系统性工作,本书虽然尽可能列举了其主要贡献者,但也有可能间接涉及课题组中的其他成员的部分工作,在此感谢课题组的每个成员的创新性研究。同时,本书在编写过程中参考和引用了大量国内外文献资料,虽尽可能地标注了出处,但也难免有遗漏,在此向有关作者表示衷心的感谢。由于我们的水平有限,撰写时间较为仓促,疏漏、不足乃至错误之处在所难免,敬请各位专家批评指正。
杜小勇 卢小宾
2019年10月