大数据与中国经济新闻生产:以财新网为例
上QQ阅读APP看书,第一时间看更新

第一节 大数据与经济新闻生产的核心概念

一 大数据及数据可视化

(一)大数据的概念及特点

关于大数据的概念众说纷纭,由于研究出发点和角度不同,学界和业界对大数据的理解或多或少存在差异。从大数据的物质属性角度出发,当前对其概念的界定大致形成了“数据论”“技术论”“信息资产论”三种。其中,“数据论”的支持者以麦肯锡公司和维基百科为代表,其认为大数据是已超出传统数据库软件操作范围的所有数据的集合。[1]国内学者徐子沛也赞成这一观点,他还提出大数据的“大”已无法用传统意义上的尺度衡量并且呈现不断增大趋势,因此无须在量级上进行统一。[2]“技术论”的拥戴者以IDC市场研究公司为代表,认为“大数据”是一种全新的架构和数据处理技术,目的是以更少的投入从海量、更新迅速、非结构化的数据中获得更多价值。[3]高德纳咨询公司则提出“信息资产论”,认为大数据是一种海量、增长率高和多样化的信息资产,但只有新处理模式的催化才能激发其中蕴含的更强大的决策力、洞察力和流程优化力。[4]不难看出,以上三种结论虽各有侧重,但仍存在共同点——它们都不约而同地考虑到大数据的物质载体,即都承认大数据是传统、常规数据软件无法处理的,这也是其区别于传统意义上的数据的核心要素之一。此外,有研究者从微观的大数据构成因子的来源角度出发进行归纳。例如冯登国等提出大数据是来自互联网活动、各类计算机信息系统和各类数字设备的数据集合。[5]官建文等则认为大数据来源于五大类,分别是政府,媒体,企业各个生产、运营环节,个人留存,物联网、传感器以及未联网的各种设备。[6]还有研究者从更宏观的大数据整体架构角度出发,认为大数据从广义上看包括大数据技术、大数据工程、大数据科学和大数据应用等领域。[7]更有研究者从大数据的呈现特点角度归纳,认为大数据是指规模大、非结构化、数据集彼此无关联且需要快速分析的数据。[8]

大数据的定义纷繁复杂,各有不同且互有交叉,正如迈尔-舍恩伯格等学者所总结的,大数据并非一个确切的概念,它更多的是指人们以一种前所未有的方式在海量数据的基础上可以做到的事情,根本目的在于获取新知、创造新价值,为人类工作、生活、思维等方方面面带来变革。[9]以上定义也呈现出大数据的部分特性。2011年高德纳咨询公司提出大数据具有“volume”(大容量)、“velocity”(快速度)和“variety”(多类型)三个特点。随后IBM公司加入“value”(价值密度低)这一特征,由此“4V理论”正式形成,这也是当前比较通用的关于大数据特征的总结。首先,数据量巨大。它的“大”已经完全超出传统数据库及计算机常用软硬件的处理能力,随着物联网、云技术的发展,各种移动终端设备等都成为数据的制造工具和记录仪器,大数据意味着人人都是数据的制造者。例如谷歌公司每天要处理超过24拍字节[10]的数据,YouTube每月大约有8亿访客。其次,速度快。主要是指数据增长速度和数据处理速度的“双快”,这一特点遵循的是实时数据处理和实时结果导向的运作原理。以生物工程学为例,2003年人类第一次破译人体基因密码时,耗时十年才完成三十亿对碱基对的排序;而等到2013年,通过世界范围内的基因仪15分钟就可达到同样的研究目的。[11]再次,数据类型多样。这不仅包括以文本为主的结构化数据,还包括种类繁杂的原始、半结构化和非结构化数据,例如来自网页、互联网日志文件(包括点击流数据)、搜索索引、社交媒体论坛、电子邮件、文档、主动和被动系统传感器的数据等。数据的持续飞速增长给数据处理能力提出了更高要求。最后,价值密度低。大数据由于采用的是“全样本”的分析手法,其中必然包含大量不相关信息,真正有价值的信息则很少。价值密度的高低与数据总量的大小负相关,如何浪里淘沙选取所需信息、探求深度价值是值得深入思考的。

在科学研究中,对研究对象的定义不明确,容易造成研究过程中的概念偷换,给研究的准确性带来负面影响。因此,本书在综合上述大数据概念和特征的基础上对大数据定义进行整合和统一,力求使其在更大范围内适用于普遍性、系统性的论述,即认为“大数据”是:借助新型计算科学技术对规模庞大、高速更新、类型多样且价值巨大的数据集合进行处理以挖掘更高价值的整体架构。

(二)大数据概念的起源、发展及“大数据背景”的时间节点划分

1980年,阿尔文·托夫勒在其著作《第三次浪潮》中首次提出“大数据”一词。1998年,美国期刊《科学》上刊登了《大数据的处理程序》一文,正式开始运用“大数据”概念。2011年5月,麦肯锡公司在其发布的《大数据:下一个创新、竞争和生产力提高的前沿领域》中,指出“大数据时代”已经到来;同年6月,IDC市场研究公司发布《从混沌中提取价值》,至此大数据开始成为人们关注的热门话题。统计显示,Google“大数据”搜索量自2011年6月起直线上升。[12]但在此之前,大数据就已经在各行业开始应用。例如Farecast公司于2004年左右就开始通过大数据技术预测机票价格走势和增降幅度,Google公司在2009年甲型H1N1流感爆发时就运用大数据技术对流感的出现范围进行预测。

当前“大数据时代”的提法十分普遍,这不禁让我们思考以下问题:“大数据”是否真的创造了一个全新时代?“大数据时代”这一提法的准确性是否值得商榷?本书认为,这一提法从学术研究角度来看并不严谨。首先,从“时代”的概念进行论证。所谓“时代”,《辞海》的定义是“历史上依据经济、政治、文化等状况来划分的社会各个发展阶段”。学者刘建明更具体地提出新“时代”的必然要素是经济、政治、文化的变迁改变了社会的整体面貌,如资本主义时代、社会主义时代。[13]我们日常生活中对某一流行现象、概念等冠以“时代”的称呼并不具有学术参考性,只能归类于口头惯性表达。其次,从大数据的内涵进行论证。“大数据”是互联网、物联网、云计算等一系列新型传播技术催生的海量数据以及应运而生的一系列新型计算技术、新思维理念等整体架构的概念集合,因此归根结底它是信息技术的子集。它虽然带来了新型的数据呈现形式和数据处理方式,但并未从根本上改变物质生产属性,也没有带来社会管理的彻底变革,因此不具有崭新的时代特征,只是信息时代的特征之一。最后,从大数据带来的变革方面论证。其中最突出的方面当数大数据对思维方式的革新,它让人们不再关注传统的“因果关系”,而是探求“相关关系”。也就是说,大数据告诉我们某一现象或趋势“是什么”,而不探求“为什么”。这一变化也存在弊端:对大数据盲目信赖容易陷入“数据至上”的误区。从深层来看,也是对科学研究核心意义的挑战。大数据带来的这一思维变革虽然有其存在的价值和意义,却无法脱离传统的科学研究范式而孤立存在。学界目前也渐渐有了关于如何将二者联合的探讨。综上来看,“大数据时代”的提法不够严谨,因此本书将统一采用“大数据背景”这一说法。

由于本书将经济新闻置于“大数据”背景下进行研究,对“大数据”这一现象和历史进程的追溯尤为重要,这就涉及对“大数据”时间节点的界定和划分,因其不仅关系到后续研究样本的采集,更是本研究的起点和关键点。“大数据”概念于2011年开始风靡,并于2012年在各国上升到国家战略层面,自此业界实践和学界研究开始增多。新闻业在数据化道路上不断探索前行,并一直充当着大数据变革的观察者、记录者和参与者。本书的研究主体是我国经济新闻生产,因此主要以大数据在我国新闻传播领域开始出现大量实践和研究为标准。本书以“大数据”和“新闻”为并列主题在中国期刊全文数据库“新闻与传媒”类文献中进行搜索,发现2012年之前的相关文献均是关于数据和新闻二者关系的讨论,例如新闻中数据的使用。从2012年开始,“大数据”概念才真正出现,2012年相关研究文献共2篇,2013年有140篇,2014年有463篇,2015年有768篇。可以看出,研究数量从2013年起呈激增态势,这与业界和学界将2013年作为“大数据元年”的界定不谋而合。因此,本研究将以2013年为研究的时间节点,对国内媒体针对大数据的研究样本选取也基本遵照这一划分标准。

当前,大数据的意义已上升到国家战略层面,许多国家都对大数据的研究和生产计划进行了详细、精心部署。以美国和我国为例。为更好地开发、利用海量数据的价值,美国国防部每年投入2.5 亿美元资助相关研究;针对人为或自然灾害、恐怖主义事件、网络威胁等,美国国土安全部展开了“可视化和数据分析卓越中心”(CVADA)项目;此外,早在2004年联邦政府就在国土安全部成立了国家可视化分析中心(NVCA),专门推动该项技术在政府部门的运用,特别是在情报分析领域的应用……我国在大数据方面的战略部署也渐趋完备,党的十八大以来,在习近平关于网络强国战略重要讲话的指导和党中央的精心谋划下,我国大数据产业取得突破性发展。2015年,十八届五中全会首次提出“国家大数据战略”,《促进大数据发展行动纲要》发布;2016年,《政务信息资源共享管理暂行办法》出台;2017年,《大数据产业发展规划(2016-2020年)》开始实施;2018年召开的全国网络安全和信息化工作会议,对包括大数据产业在内的信息化发展战略进行了全面部署。截至2018年底,我国已建成国家政府数据统一开放平台。

(三)数据可视化的内涵和意义

21世纪以来,随着数据仓库、联机分析和数据挖掘技术的不断完善,数据可视化概念不断被提及,并越发成为完善数据产业链的关键环节。“数据可视化”并非一个新词,对这种方法的运用早已有之,只是随着时代的进步,相关技术手段越发先进和成熟,不同时期对数据可视化的内涵界定也有所不同。新闻媒体对可视化的运用最早可追溯至《今日美国》的乔治·罗瑞克综合运用颜色、符号以及注释等手段绘制气象图表,创造性地把该报纸提升到视觉化层次。目前学界对数据可视化的定义并不统一,维基百科认为它是“借助于图形化手段,清晰有效地传达与沟通信息”的视觉传播方式。Michael Friendly和Daniel J.Denis认为其是一种运用示意图等视觉化形式表现数据的科学。无论定义如何变化,数据可视化始终包含两个要素,即它是“处理数据的一种手段”,并且“需要通过视觉化方式传达信息含义”。

大数据的出现意味着数据量的爆炸式增长,这种态势呼唤更为专业的数据呈现工具出现。在这种需求的推动下,数据可视化相关产品迅速增多,从以饼状图、柱状图等为代表的静态、简单、传统可视化呈现方式,到如今的动态、交互、多媒体的立体多维可视化呈现手段,曾经冰冷、枯燥的数据在可视化技术的催化下“活”了起来。本书结合大数据的研究背景,认为当前环境下数据可视化的含义是指以静态、动态甚至是交互式图表或图像等方式来呈现数据、演绎数据的科学研究手段。

二 经济新闻

(一)经济新闻的概念

作为我国新闻报道中的“基础新闻”“骨干新闻”,经济新闻历来受到新闻业界和学界的重视。但是,对于什么是经济新闻以及经济新闻到底面对何种报道对象,研究学者莫衷一是。在长久的发展过程中,经济新闻的定义大致出现了“经济事实”说、“经济信息”说和“经济选择”说三大类别,三种分类各有侧重和理论依据。[14]“经济事实”说从新闻的呈现形态出发,以“新闻即事实”这一国内较为通行的“新闻”定义为基础,对经济新闻进行概念界定。张颂甲提出经济新闻是“对新近发生的经济事实的报道”[15]。彭朝丞在此基础上提出经济新闻的功用是“反映、服务和引导社会经济活动和人民群众经济生活”[16]。徐人仲进一步划定经济新闻的报道范围,包括“经济建设、经济改革、经济生活”[17]等一系列经济活动。“经济信息”说则将新闻的构成本源进一步细化,认为经济新闻传递的是一种经济信息,代表学者有余镇邦、黄其庄[18]和仇学英[19]。“经济选择”说则受现代古典经济学中针对资源配置的理念的影响,认为经济新闻报道的是人们如何进行经济选择和经济决策,代表学者有樊凡、时统宇[20]和王华庆[21]

李道荣等通过借鉴古今中西方大量资料对比分析了以上三类定义,并结合马克思主义政治经济学理念,对经济新闻报道的对象和范围按照重要性排序,在此基础上总结出经济新闻是对“人类社会最新的经济活动、经济关系和最新的自然经济现象的报道”[22]。这一定义可谓融三者之长,更加全面、准确、科学。

和“经济新闻”相似且经常被提及的一个概念是“财经新闻”。目前针对“财经新闻”的定义,学界一直存在争议,大致可分为以下两种主流意见。一种意见认为财经新闻相较于经济新闻,其关注范围更为细化、复杂和专业,专注于财政、金融、市场、贸易、证券等领域;另一种意见则认为财经新闻与经济新闻在内涵和外延上都高度重合,前者可以看作后者在市场经济时期的新提法,都是有关经济活动、经济现象和经济决策的最新事实和情况的报道。本书结合学界以上两种主流意见,进一步总结认为,财经新闻本质上就是经济新闻。随着市场经济的发展,财经新闻的报道范围不限于财政、金融领域,而是覆盖了社会生产、分配、交换、消费等各个环节。尤其值得注意的是,在市场经济时代,财经新闻更多地以消费者和投资者为核心受众,这是它区别于以生产者为核心受众的传统经济新闻的关键之处。

(二)经济新闻的特点

经济新闻作为新闻的一个重要品类,不仅具备新鲜、重要、真实等基本的新闻价值要素,还有区别于其他类型新闻的个性特点。在中国特色的传媒生态中,我国经济新闻报道的以下四个特点尤为突出。

一是政策性。作为我国党和人民的喉舌,新闻媒体在报道经济新闻时,应始终以宣传党和国家的经济政策,配合政府的经济建设工作为首要任务。因此,政策性是经济新闻报道的基本和首要特点。这一特点体现在经济新闻报道的方方面面,如直接传达经济政策的颁布和实施,解读政策和法规蕴含的精神,剖析或预测其对社会经济生活的影响,等等。二是专业性。经济是一门复杂、抽象的社会科学,经济新闻则由各种经济学原理、经济发展规律、复杂的经济关系等内容贯穿始终,专业性是其固有特点。它不仅体现为报道内容的专业性特征明显,还体现为报道方式的抽象性和概括性,如对经济学的专业术语、精准的数字和复杂的图表等的运用,其中数字和图表历来是经济新闻报道的惯用呈现手段。三是服务性。随着改革开放以来我国社会主义市场经济体制的确立和党的工作重心转移到经济建设上来,我国的新闻体制也实行了重大变革,经济新闻报道范围在很大程度上得以拓展。对经济政策的上传下达,做出种种分析预测,为政府、企业和个人的经济行为提供参考,无一不体现了经济新闻的服务性特点。尤其是2011年8月新闻战线组织实行“走转改”活动以来,经济新闻报道更加注重人文关怀,对群众的服务性、贴近性更加凸显。想群众之所想,为群众服务,满足受众需要,这也是经济新闻适应社会主义市场经济环境的内在需求。四是前瞻性,这一特点从根本上说是服务性和专业性的延伸。预测经济形势和市场趋向,为经济活动提供指导,已越来越成为经济新闻报道的常态要求之一。[23]

三 新闻生产

(一)新闻生产的概念源起与发展

新闻生产理论的源头,可以追溯到H.拉斯维尔在《传播在社会中的结构与功能》(1948)一文中提出的“5W”线性传播模式,即“who”“say what”“to whom”“in which channel”“with what effect”。“5W”模式表明传播过程是一个以影响受众为目的的行为过程,此模式中的“who”就代表了新闻媒体(组织)以及为它工作的人(组织中的个人)。20世纪50年代,大卫·曼宁·怀特在《把关人:新闻选择的个案研究》一文中首次提出“把关人”[24]概念,他认为电报编辑中人的主观因素对电讯稿的影响最大,这一理论意识到新闻机构对新闻产品生成的作用,使得新闻传播过程中作为把关人的“编辑”的作用得以体现,为当代传播学体系的深度发展与完善打下了良好的理论基础。然而,它把新闻制造看作某种封闭、孤立的简单传播行为,认为新闻生产过程中选择和判断标准仅仅是出于个人的主观价值。这种理念对于“把关人”之所以能够成为把关人的先决条件、何种新闻采用何种方式能到达把关人手中等一系列复杂、前设问题没有进行深层考量,忽略了传媒的所有者、传媒的组织特征等宏观因素对新闻传播的影响。

本质上,新闻生产过程同样也是社会生产过程,因此考察新闻生产不能忽视媒介组织内部的科层结构、劳动分工及规章制度,若仅仅关注已完成的新闻产品,注定只能是管中窥豹,难见精深。因此,新闻学的研究路径中逐渐发展出新闻生产社会学一支,以社会学的视野及方法进入作为社会生产过程的新闻生产过程,甄别其特征,考镜其源流,辨析其脉络。唯其如此,在了解新闻报道的是什么之余,为什么如此报道才会浮出水面。赫伯特·甘斯[25]、迈克尔·舒德森[26]、伯纳德·罗胥克[27]等学者创造性地将新闻生产研究引入更宏观的社会学研究视角,他们认为新闻的生产方式以及引发的媒介效果是一个多变的研究领域,需从社会文化的视角对整个新闻业进行反思。这些学者也是“建构论”的支持者,他们普遍认为作为一种社会机制和文化的新闻,是社会建构的现实,这就为本研究提供了基本的理论范式。

(二)新闻生产的内涵

国内学者张柱认为,“新闻生产”具有名词和动词的双重含义,作名词讲时,新闻生产是指新闻实践;作动词讲时,是指从信息加工到传播的一系列过程。[28]刘义昆、赵振宇认为,新闻生产是指由新闻生产主体、客体和两者呈现的生产关系这三类要素所组成的生产过程,并且这一生产过程在新媒体出现前后呈现出截然不同的特点。[29]新媒体出现之前,新闻生产的主体单纯指新闻机构及从业者,且生产过程大致遵循“选择—加工—传播”的单链条路线;新媒体出现后,新闻生产的主体由专业媒体人群体扩展到包括管理者、受众在内的所有信息提供者,且新闻生产开始从传统的组织化生产向新媒体平台转移。[30]但无论新闻生产的流程如何改变,其始终包含信息的选择、加工、传播、反馈等一系列过程及其中各环节的互动影响。

因此,从宏观方面来看,新闻生产不仅包括新闻生产流程,还包括新闻生产的理念变革、产业转型模式、生产运作方式、新闻呈现方式等一系列复杂因素,这也是本书对新闻生产内涵的界定和研究的基本思路。