
1.4.3 信息分析方法的演进与发展趋势
信息分析活动是情报活动中一种具有相对特殊性的活动。信息分析通过对原始信息(包括情报机构收藏积累的信息,也包括它们通过搜集、检索而获取的信息)的识别、鉴定、筛选、浓缩,或分解、重组、综合、推断,从原始信息中获取用户最需要的信息。信息分析产品既是原始信息的科学浓缩与提炼的产物,同时又凝聚了情报人员的创造性工作的智慧。如果说一般情报工作侧重于通过对信息的搜集、整理、标引、检索及服务帮助用户更好地获取情报,那么信息分析工作则侧重于帮助用户更好地利用情报。
随着科学技术的高速发展,信息化进程的加快,信息资源已成为人类经济活动、社会活动的重要战略资源。信息分析越来越广泛地深入经济、社会、科技等各个领域。信息分析方法在20世纪70年代以定性分析方法为主,80年代开始将数学方法广泛应用,90年代一批定性与定量相结合的方法活跃在信息分析领域。进入20世纪80年代以后,随着发展中国家经济快速崛起,以及全球范围信息需求及其利用数量的不断增长,以解决和消除科学领域“信息爆炸”为己任的信息分析理论研究与实践,在情报需求不断增强和信息来源渠道趋于多样化的背景下变得日益广泛。
尤其是在大数据的环境下,已有理论体系正逐渐被打破,越来越多的计算机学科、统计学课的理论与方法纳入信息分析领域中来,甚至相关学科的研究者也开始跨学科关注和从事这一领域的研究,使得信息分析逐步跟上人类丰富多彩的创新实践活动,使理论研究前沿与实践更好地结合,使实际问题的解决得到理论的有效指导。大数据,这个概念描述的是当前数据环境的特征,顾名思义是大规模的数据集,但它又不仅仅是一个简单的数量的概念。IBM公司指出,大数据的特点是4个V:volume(大量)、velocity(高速)、variety(多样)及veracity(真实),它提供了在新的和正在出现的数据与内容中洞悉事物的机会,使业务更加灵活,并回答以往没有考虑到的问题。Gartner公司的报告也提出,大数据是大容量、高速和多样化的信息资产,它们需要新的处理方式,以提高决策能力、洞察力和流程优化。大数据分析与信息组织和信息分析都有密切的关系,在各个领域中都有应用。今天面对的商务、政务、医疗、安全、气候变化都是大数据的环境,不是数百篇文献可以涵盖的。目前,信息分析方法中除了常规的统计学、数学和决策科学的方法外,随着计算技术、互联网的发展,已经出现以下几种趋势。[1]
第一,综合利用多种信息源。有研究者从军事情报角度指出,军事情报界需要综合利用人际情报、信号情报、图像情报和外部情报,进行全资源信息分析(all-source analysis),即利用多种不同的信息资源来评估、揭示、解释事物的发展,发现新知识或解决政策难题。科技情报界也是如此,如利用科技论文和专利,发现科技之间的转换关系、预测技术发展方向,综合利用政府统计数据、高校网站、期刊、报纸、图书等来评估大学等科研机构。可见,综合利用多种信息源是从问题出发,系统化地整合所有相关信息资源来支持情报研究,信息源可以是学术论文、专利等不同类型的文献集合、文本和数据的集合,也可以是正式出版物与非正式出版物的集合等。
第二,注重新型信息资源的分析。随着网络应用的深入,出现了许多新的媒体形式。Andreas M. Kaplan等人将构建于Web 2.0技术和思想基础上,允许用户创建、交换信息内容的基于网络的应用定义为社会化媒体(social media),包括合作项目(如维基百科)、博客、内容社区(如YouTube)、社交网站、虚拟游戏世界和虚拟社会世界(如第二人生)等六种类型。这类媒体形式依托于Web 2.0等网络技术,以用户为中心来组织、传播信息,信息可以是用户创造性的言论或观点,可以是围绕自己喜好搜集的信息资源集合等。由于社会化媒体具有易用性、快速性和易获取性等特点,它们正迅速地改变着社会的公共话语环境,并引导着技术、娱乐、政治等诸多主题的发展。这些通过庞大的用户社区来传播的高度多样化的信息及其网络结构,为洞悉公众对某一主题的观点、研究信息扩散等社会现象、预测未来发展方向等提供了机会,有助于发现有共同兴趣的社群、领域专家、热点话题等,带来了网络舆情分析等研究内容。此外,这类信息结合其他类型的数据,产生了新的情报研究领域。例如,智能手机的普及和GPS的广泛应用,使得可以从社交网络和网络交互数据、移动传感数据和设备传感数据中获取社会和社区情报(social and community intelligence,SCI),揭示人类行为模式和社群动态。
第三,信息分析研究的智能化,数据挖掘和机器学习技术逐渐成为广泛应用的方法。大数据背景下的情报研究,对技术提出了更高的要求。正如美国国家科学基金会(NSF)发布的报告所说,美国在科学和工程领域的领先地位将越来越取决于利用数字化科学数据以及借助复杂的数据挖掘、集成、分析与可视化工具将其转换为信息和知识的能力。对于情报研究来说,应用智能化技术能自动进行高级、复杂的信息处理分析工作,在很大程度上把情报研究人员从烦琐的体力劳动中解放出来。尤其在信息环境瞬息万变的今天,及时搜集信息分析并反馈已经变得非常重要,这都需要智能化技术加以支撑。从信息源来讲,情报研究对象得以扩展,其中可能包含微博等社会化媒体信息,可能包含图片、新闻等,大量非结构或半结构化数据的涌入,必然需要技术将这些数据转化为结构化数据,以供后续分析。同时,多元化的信息需要根据分析需求加以融合,这可能需要语义层面上的技术支持。简单的统计分析已不能满足现在社会的决策需求,需要从大量信息中发现潜在模式,指导未来的发展,这就涉及数据挖掘、机器学习等技术。此外,要寻求情报研究的客观性,摒除过多的主观意愿,也需要多种技术来支撑。可见,这一发展趋势是大数据时代下的必然。各国都在积极建设的数字化基础设施,也推动着情报研究的智能化发展,如欧洲网格基础设施(european grid infrastructure,EGI)项目就致力于为欧洲各领域研究人员提供集成计算资源,从而推动创新。
[1] 李广建,杨林.大数据视角下的情报研究与情报研究技术[J].2012(6):1-8.