第四节 大数据带来的变革
一、大数据产业的关键节点
(一)数据的挖掘和存储:对应云技术的运用和升级
云计算是大数据存储和分析的重要基础设施,正是云计算的发展迅速推动了大数据产业的发展,原因有如下三点:一是云计算按需付费和资源共享的特性降低了企业产生和使用大数据的门槛;二是低门槛的特性又推动了大量中小企业使用云计算,从而提高企业信息化程度,加速了数据的产生;三是云计算低使用成本高计算能力提升了企业的大数据处理能力。
云计算促进大数据产业发展的方式,如图1-6所示。
图1-6 云计算大大促进大数据产业的发展
(二)数据的整理和分析:对应算法与AI的运用和升级
大数据算法及人工智能的迭代升级提升了数据分析能力。深度学习(deep learning)算法突破性地以更接近人脑的方式利用大量数据训练机器,通过训练使其自主掌握规律,而且结果将会随着数据量的不断增长而更加准确可靠。
(三)大数据技术的运用场景:对应政府、企业的开放,体量越大的传统行业,蕴含越大的大数据空间
根据《中国大数据发展调查报告(2015年)》统计显示,过去制约企业大数据发展的最主要因素首先是政策限制(例如,隐私保护);其次是数据资源的短缺和技术水平的不足;再次是投资大而没有看到明显效益;最后是诸如人才短缺等其他原因。政策方面,由于政策、法规的滞后性,数据跨部门、跨企业、跨行业甚至跨领域流动的需求被牢牢禁锢,这也使得政策限制成了摆在我国企业大数据应用面前的最大障碍。数据资源增长迅速,但是如何通过技术手段获取高质量的数据是企业面临的重要问题。
但随着政府对大数据战略的日益重视,政府和企业的数据开放流动正在开始。
政府拥有最丰富和最优质的大数据资源,各个政府部门掌握着社会第一手的原始数据,如房地产、医疗、教育、金融、交通、旅游、气象、电力、海关、司法、人口等各类经济和社会运营的基础数据。过去政府数据更新频率低且未向社会开放,因此社会并未充分挖掘这一块数据的价值,目前政府已经意识到数据的重要性并出台政策逐步开放大数据供社会利用。若政府大数据获得有效利用,将产生巨大的价值。
相应地,企业的经营中也将产生大量数据,包括用户信息、用户行为、产品运行数据等。根据《中国大数据发展调查报告(2015年)》显示,企业对大数据资源最大的需求来自企业信息公开,继而是政府所拥有的大数据信息。过去互联网数据已经进行了大量的应用,未来随着企业销售、供应、经营的互联网化,企业与客户、供应商、中间商的互动互联网化将产生大量的数据。
二、大数据带来的六大趋势
信息技术的发展带来了产业形式、经济形态、商业模式、组织模式、文化习惯等多方面的变革,从表1-1中可以更清晰地看出产业变革的重点方面。
表1-1 信息革命带来的产业变化
大数据的发展为我们带来了第二次信息革命,经过几年的发展,大数据即将带来的产业变革趋势已初见端倪。从当前的经济发展水平与大数据技术的融合中,可以预见的未来,几项已经存在的发展趋势正在扩大。
(1)应用无线化。大数据技术的广泛应用为数据采集与分析提供了更大的便利性与移动性,让终端设备与资料采集的作业更弹性而有效率,也为智能生活带来了可能。
(2)信息数据化。数据信息无处不在,而大数据处理数据的高速巨量、多样化、在线化使得信息的流通、交换、加工、运用更趋标准化与结构化,数据的应用变得更即时直接。
(3)交易无纸化。大数据、云计算支持下的在线交易平台凭借其实时性、便利性正在迅速地替代传统的线下交易与纸质凭证,彻底地改变了交易行为与资金流,并赋予未来微经济商业模式更多创新思考的可能性。
(4)思维智能化。大数据所产生的创新价值与人类交互并深入于生活之中,极大地改变了人们传统的思维方式,人的思维与新科技将会迎来前所未有的碰撞与火花。
(5)决策实时化。数据处理、分析技术的提高,改变了过去因数据获取成本过高而面临的信息不对称的困境,能够实现过去难以达到的实时性和精确性,大数据实时采集与加工极大地改变了决策与信息关系。
(6)线下线上化。海量数据使得线上与线下更加融为一体,未来仍将呈现线下更多地运用线上数据倾倒的趋势,线上与线下将连接在一起不能分割。
这些本质上的转变将会贯穿未来大数据发展的进程中,六个趋势会在各自的体系内深化发展与创新。商业价值会逐渐落地于各行业中,数据技术成为各行各业的优化工具或产生颠覆性创新。大数据本身的发展也将被自我颠覆,数据的釆集、更新、识别、关联将会变得越来越自动化。
三、数据变革带来的五大领域颠覆
大数据带来的趋势转变将逐渐改变我们生活的方方面面,其中有几个领域将率先面临颠覆。
(一)数据安全
随着大数据的广泛应用,数据安全日益引起关注。2015年数据安全事件频发,随着全球各国逐渐采用更先进的数据安全技术并制定更完善的数据保护法律,数据安全监管趋严将是未来的一大趋势。
在数据安全方面,相比商业机密的保护问题,人们更注重的是如何守护个人隐私。数据安全意识提升的背后是人们对数据公开化及其风险的担忧。如果数据风险无法被有效管控,人们就无法在真正意义上信任数据,而这将在很大程度上阻碍日益发展的大数据产业。个人的隐私、公司机密乃至国家与国家之间的数据保护,将会是未来亟待完善的部分。当数据成为商业重要且关键的资产时,像“首席数据隐私官”这样的职业也就应运而生了,数据安全与数据隐私保护成为数据应用中不可或缺的一部分。
(二)分析的简化与外包
数据分析工作的简化与外包,预示着未来大数据将会向产业链分工的趋势发展。随着数据信息的迅速膨胀和大数据应用的逐步落地,越来越少的企业可以独立完成从原始资料采集、加工、分析乃至落地应用的完整程序。未来数据的每一个处理阶段,都有机会发展出专门的技术公司协助企业完成大数据应用前的整备工作。大数据产业链上的每一个环节都有可能产生新的问题与创新,大数据产业革新的每一阶段都有可能激荡出新的问题与机会。新的问题不断地聚焦起来,对应的数据源也趋于集中,这时一个新的产业链机会也就随之产生。中间层(iddle layer)的服务与创新,对于大数据产业的发展将扮演着至关重要的角色。
(三)政府的数据态度
从大数据产业链的整体来看,政府拥有最多的数据。因为政府锁定了大部分公共服务领域的关键数据源,它是公共数据开放的大资源,也是一把驱动大数据的金钥匙。政府的数据涵盖金融、医疗、能源、食品、交通、治安、环境等多个方面,且所有这些数据都是相对集中且十分关键的,政府数据的开放将是产业创新的催化剂,对于整体数据产业的发展也至关重要。2016年,我们可以观察政府对于公共数据开放的态度,而各个行业也可以顺应政府数据政策的脚步,开始尝试进入大数据驱动乃至大数据变革的第三阶段。
(四)多屏时代
过去几年间,手机极大地颠覆了我们的生活,但随着大数据的发展,可以预见未来有两个新的屏即将改变我们的生活:一方面是Smart TV,即家里的电视屏,收集你看过节目的相关数据并且会向你推荐你爱看的节目,形成了自然数据闭环;另一方面是物联网汽车,将来所有汽车的内部都会像Tesla一样,中央显示屏控制每个部分、记录汽车行驶中的所有数据,信息的流动由此产生。可以根据时间分配(time share)和载具分配(device share)这两个层次来思考这个问题:通常情况下人在不同的时间会因为当时具体的环境状态,对不同的设备具有不同的依赖程度。在家时对Smart TV的依赖一般会比手机高,而离开家前往下一个目的地时,则更需要的是手机,如果是自己开车,车载导航或车载屏幕将会成为主要的关注对象。因而,未来互动的过程中我们应当更加关注如何采集到有价值的数据,并进一步对使用者的日常生活做出优化的回馈。
(五)数据行业化
互联网影响比较大的行业必然更容易数据化,因而大部分大数据应用的落地点都与特定行业相关,已经崭露头角的就有金融、医疗、电商等行业。下一步大数据的应用应该会在不同的领域各自发展,并不存在适用于每一个领域的通用的解决方案,而包括零售、医疗、教育、金融等行业都将因“互联网+”的带动而发展。很多小公司起步,产生了很多小数据,这是从0到1的过程,然后整合碎片化的数据,最后积累大量数据。这三个进程的时间点加上不同的应用,铸就了行业大数据。未来大数据将从过去的浅层连结(weak link)转变为深层连结(deep link)。从大数据由浅而深的演变中可以观察到:从前习惯以行业为出发点,思考网络(数据)可以帮我们做什么,到了互联网和大数据的时代,则转变为以网络(数据)为出发点切入思考,再把原行业的思维放进来碰撞,看看可以激荡出什么样的创新思维。Uber、Airbnb都颠覆了以往行业运用网络的概念,但只有这种思考与创新的方式才能将跨行业的东西提升出来。
四、大数据变革下的三大关键行业机会
从大数据对传统行业的颠覆来看,主要的机会在于中间层,尤其是在金融与保险、医疗、零售这三个行业。
(一)金融与保险
用一个词概括金融在大数据时代的机会点,那就是“微(micro)”。过去很多的创新都受到技术和数据能力的局限。未来数据的采集、加工和应用都将实践个人化的价值,将会激发很多金融商业模式。数据动态的意义,首先体现在金融保险体系里的客户监测。过去个人信用评估结果都是滞后的,往往无法有效地反映最新的个人信用风险,导致银行或是保险公司不能提供最符合顾客需求和利益的服务。其次体现在将解决服务合理性的问题,也就是当客户使用了服务时,才向客户收取费用。
以汽车保险为例。过去我们对于汽车保险的保费设定,是根据客户过往的驾驶肇事记录来调整保费费率的,也就是说汽车保险的价格标准建立在投保车主的驾驶行为基础上。但肇事记录通常具有滞后性,在大数据时代可以利用更便捷的数据采集系统收集更动态的数据,用以预测危险驾驶的风险。或许,未来的汽车都会像特斯拉一样,通过车内安装的传感器,记录驾驶员如何踩油门(如习惯性的紧急刹车就是一种危险驾驶的讯号)、换道时是否打方向灯、是否频繁地按喇叭等行为。这些资讯都可以推断出驾驶员是否拥有安全的驾驶习惯。如果再把驾驶员的行车路线数据与政府公布的危险肇事路段的数据做对比,就可以知道这辆车每天上下班的路线属于怎样的安全等级。综合以上两类数据,即便没有肇事记录,保险公司也能根据这些数据来动态调整风险评比,并随时调整保费的费率。同理,如果车险是为了确保用车人在驾驶期间的风险,那么通过车辆的传感器,可以清楚了解这辆车有多少时间停在车库、又有多少时间处于被使用的状态,保费的计算也可以根据车辆实际承受风险的时间来对客户收费,这也就实现了前面所提到的动态计价。
(二)医疗
医疗领域当前所面临的最大问题是数据未能整合,不同医院之间未能实现数据信息的互通,比如在A医院却拿不到之前在B医院开的病历。另一个大问题是中国人口老龄化严重,导致医疗费用负担沉重,因病返贫十分常见。只有降低医疗成本,减少资源和药物的滥用,才能根本性地减少政府负担,让资源分配给真正需要的人。美国福特公司的30万员工,每年享有30亿美元的医疗保险预算,但这笔钱过去只有一个人在管。1997年福特在这方面第一次引入数据应用,分析之后发现有人竟然150岁还在领医疗保险,有人一年领两次怀孕补助等不合理的现象。这些都是无谓的资源浪费,但如果不通过数据,可能永远也不会发现这样的谬误。医疗是一个连续性的行为,一个人从健康、亚健康乃至疾病的阶段都不是突发的,背后都有遗传或是生活饮食习惯的脉络可循。很多疾病的危险信号常常是因为信息未能互通而被忽略,如果充分利用信息则可减少危险发生,如美国曾经通过传染病传播数据,预估要生产多少疫苗以及各区疫苗使用状况,大大地提升了疾病防治效果。
(三)零售
对于零售业,最重要的就是如何运用数据把供应与零散的需求做匹配。买家希望得到的是:“我要什么?最快帮我找到我要的东西。给我最好的价格,用对我最方便的方式付款,在刚好的时间送达。”商家就会成为赢家。供应方则希望知道:“怎样才能满足消费者?怎样用最小的库存,最快的方法,最合理的利润率来服务顾客?供应链的处理怎样可以变得更好?怎样减少成本浪费?”以数据驱动为基础的线上零售发展已经十几年了,但线下将会出现什么情况?当POI逐渐成熟,拿着手机,处处都能发挥大数据的连接能力,时刻都是机会点。人们懒得再特地下载一个应用程序购物,线上再发达,某些时候它也不是最方便的渠道。要想改善零售用户的体验只有开展全渠道的服务,对零售业来说,最好就是线上线下都能覆盖到。只有online的应用程序是不够的,最好连offline的渠道都能拿到,不然很容易就会被别人弯道超车,因此全渠道的打通和合作策略是零售业在2016年关注的一个重点。
“推荐”将是另一个爆点服务。现代人能在同一时间享受多种服务,浏览多种产品讯息。但数十万款与你有关的商品摊在你的眼皮底下,你怎么选择?人主观上都希望自己可以选择,但面临太多选择时,选择本身反而变成了一种负担。所以未来的“推荐”应该是游合于“优选”与“逛”之间。大数据让手机变成个人消费助理,不断跟着你走,也不断领着你走,就会在商家和消费之间成为一个媒介。最后,零售业的根本是“生产”问题。数据将成为产品创新和改良的依据,从设计到生产、包装、销售、售后的过程中观察与不断优化,最终能够帮助商家生产出符合顾客需求的商品。虽然是老话一句,但还是不得不再重申一次:“大数据时代对零售业来说不是一个单纯的转型问题,而是一个攸关存亡的生死问题。”
五、数据交易的变革
(一)数据交易的本质
数据的本质,是蕴含在数据背后的信息和知识,其与普通商品的流通有着完全不同的特征。要想清晰地了解大数据带来的数据交易的变革,就需要深入探索数据交易本身的固有特征。
数据交易的第一个特征是数据是一种无形、能反复交易的物品。数据的交易,与传统商品流通或者互联网的流量交易与变现的最大区别就是数据的可反复交易性。从理论上说,数据可以同时卖给各个不同的买家,因为数据出售的边际成本接近零。这一特征与数字内容十分类似,数字内容包括了软件技术、游戏、电影、唱片等拥有明确版权的无形商品,它们的共有特征同样都是内容制作需要大量的成本,但后续销售的边际成本接近零。
在定价理论中,像数字内容这样供应量无限的商品,其最优定价是客户群的平均客户感知价值(customer perceived value, CPV),即买家内心感知该商品的实际价值,相当于买家意愿中的最高出价。而在实际中,有大量的应用采取免费使用、后向变现的模式,因为免费应用可以通过会员制、流量变现等方式构筑严密的商业模式闭环。而数据则带有准生产资源的性质,只要能合理分发到特定的需求方,数据很容易就能转变为价值。而对于一个商业模式最为关键的一点,就是能创造显著与持续的收益,而对数据进行大规模免费共享并不是实现总体收益最大化的模式。而数据不适合共享的第二个原因,就是数据的价值相对性。即使是同样一个数据集,对于不同的企业其价值可能有天渊之别。因此,对于数据这种相对价值差异极大的产品进行定价,免费模式就几乎不可能达到经济上的帕累托最优。
数据交易的第二个特征是数据价值的相对性。数据需求方的不同要求,使得某些数据对于特定的人群是有价值的,而对于其他人群其价值十分有限。即使是拥有对于几乎所有的企业都是非常有价值的数据,例如拥有整个中国13亿人的兴趣爱好标签数据,但实际上大部分企业只是需要其中的一部分而已,如母婴电商只需要关注其中的女性用户数据。让数据需求方把全体数据买回去显然是不符合市场规律的,数据交易需要给予数据需求方“挑数据”的权力。
上述案例充分说明了数据总体价值在需求方中的差异性,以及数据本身内在价值分布的差异。对于大部分数据交易,使用传统商品交易的方式,即供给方简单为数据贴上一个价格标签挂平台出售的方式是不合适的。而采用竞价拍卖,即需求方定价,显然更符合市场的实际情况。
数据交易的第三个特征是交易不局限于数据本身,还包括知识。这个看起来非常显而易见的观点,实际是数据交易中最为核心的原则。在未来成熟的数据交易市场中,主要交易的量会围绕蕴含在数据背后的知识,而数据的知识发现(knowledge discovery in data, KDD)将会是数据交易市场的核心任务,其中的道理也是显而易见的,需求方分别把数据买回去然后做个应用无疑是不经济的,更好的模式是,知识已经由数据交易市场以云计算的形式处理好,由需求方直接购买回去使用。而至于怎样对这些“无价”的知识进行定价出售,数据交易市场需要设计一套巧妙的机制,通过需求方定价的方式去激活市场。在未来,数据交易产品化将会是重大趋势,而数据知识发现是其中的核心问题。
数据交易的最后一个特征是数据涉及的隐私性。目前的数据交易之所以困难,在于大部分有交易价值的数据都与用户的个人隐私有紧密关联。如国内三大电信运营商虽然具备用户全行为洞察以及跨屏数据的巨大优势,但在数据变现中脚步蹒跚,最主要原因在于用户隐私红线。因此,在数据交易中必须把数据当事人也考虑在内,充分考虑数据交易的“四方关系”。
(二)未来的数据交易市场
除非数据交易市场的存在能够显著降低数据交易的交易成本,否则数据交易双方是没有任何理由在交易市场开展交易的。数据交易的成本,由搜寻成本、因信息不对称导致的风险成本、议价成本(狭义的交易成本)组成。其中搜寻成本是数据买卖双方对接需求并成功撮合所需要付出的成本;而风险成本是由于数据交易的双方信息不对称,所出现的卖方夸大数据价值、以次充好等道德风险行为;而议价成本是双方在数据定价问题上讨价还价带来的价值损耗。如果缺乏一套有效的数据定价机制,则交易双方会围绕数据定价损耗大量的精力与成本,将大大降低市场的效率。
下面我们从数据交易市场的交易对象、参与方与定价这三个不同的角度阐述数据交易市场运行的模式及其定价机制。
1. 数据交易市场的交易对象
数据交易市场的交易对象就是可交易的数据,可以分为两类:第一类是非闭环数据,即不涉及任何个人隐私的统计性与科研数据,如各类经济及行业统计数据、用于工程及研究目的的数据,如声音语料库、城市交通数据、匿名的上网行为数据等。这类数据由于不涉及个人隐私,一般可以认为产权属于所有方,采取“柜台式”报价挂牌交易即可。
而国内数据交易平台——“数据堂”就是第一类数据交易的典型,这类数据在交易过程中的搜寻成本相对较低,通过传统的检索技术就能快速撮合数据买卖双方,但也存在出售方夸大数据价值、以次充好的风险成本。有一个具有启发性的思路是,数据交易中心可借鉴手机应用商店做法,设计激励政策将数据供给方的角色从“出售者”转变为“数据长期运营者”,即鼓励供给方不断维护、升级所提供的数据,比如勘误、定期更新数据(类似应用商店中的版本管理),激励手段如给予活跃维护数据的供给方的数据产品提供在平台上更多的曝光、平台扣取部分收入做根据购买者售后投诉情况的备用赔付金等。长此以往,数据需求方不再是花钱“购买数据”而是“订阅数据”,这样不仅能减少提供方“以次充好捞一票就走”的行为,也更能体现交易对象是数据服务的本质。
实际上第一类数据的交易中还存在另外一个交易风险成本,那就是如何保证数据购买方获得数据以后,不会私下把数据重复卖给其他需求方,这个风险不解决,势必在大范围数据交易中降低数据供给方对于数据收益的预期,从而导致数据供给方不得不提升数据售价,反过来迫使购买方通过私下倒卖的方式降低自身购买成本,形成恶性循环。从这一角度出发,数据交易市场可以通过指定规则与设置技术手段提升购买方的违规成本,如严格的准入与会员等级特权制度,促使购买方珍惜自身交易资格避免违规,同时运用技术手段在数据中加入用于识别的随机信息,从而轻易追查出私下倒卖的会员。
而数据交易中的第二类数据,即涉及个体用户的行为与兴趣的隐私数据,蕴含着巨大的商业价值。这类数据交易前应把PII信息(个人身份可辨识信息)去除,但用于找出这个用户的虚拟用户身份标识是不能被去除的,否则哪怕数据再有内涵,无法定位到用户并转变为营销与洞察,这类数据都是难有用武之地的,但保留用户身份标识又涉及了隐私保护的问题。正是由于对于隐私保护的忧心忡忡,第二类数据的交易难度与成本都非常的高,而如何促成这类交易,则是数据交易市场的核心任务。
无论是个人征信、在线广告定向、大数据精准营销都与细分到个人的第二类数据密切相关,同时在线广告业的实践证明,这类数据虽然涉及隐私问题,但并不是不可交易的,需要的是一套隐私保护与管理机制。同时,第二类数据交易也将会是未来数据交易的核心内容,而交易过程的隐私保护与管理机制同时将会是数据交易市场的核心竞争力。
此外,对于数据交易的最佳隐私保护方法不是试图隔离用户的知晓,而是让用户这个数据当事人能参与其中,甚至获取部分数据交易的收益。例如,对于允许自身数据被制作为兴趣标签的用户,在精准推荐中能获得商家更好的折扣。如此的良性互动才能提高数据交易市场的效率。
2. 数据交易的参与方
现在业内每当在新挂牌的数据交易所会员名单中,发现赫赫有名的互联网巨头时都会莫名兴奋,仿佛数据交易即将会因为这些数据资产寡头的到来而即将被激活一样。但数据交易市场作为一个双边平台,其兴起的根本要素在于具备足够数量的活跃供给和需求方,除了巨头以外,更应当关心长尾数据,即散落在不同所有者上的零散数据,每个所有者拥有的数据量不会特别大,因此不足以激励他们想办法变现数据。而数据交易中心则作为一个平台能够提供便捷的数据变现能力,需要吸引到长尾数据供给方的到来,并提供平台能力帮助中小数据供给方变现手中的数据。
大数据交易的价值,还应该体现在交易的多样性上,如何吸引长尾数据的到来,是数据交易市场的另外一个关键任务。
3. 数据交易的定价
数据交易市场的存在就是为了降低数据交易中存在的高昂风险成本。针对特定的数据,我们应当采取不同的定价策略,实现交易成本的最小化。因此,下文把数据交易的定价分为第一类数据和第二类数据。
第一类数据即不涉及用户隐私的统计或科研数据,其定价相对比较简单,大部分情况下,采取供给方定价的形式就足够了。一方面是因为这类数据不涉及个人,其价值相对性的波动不大,无须采用更复杂的定价模式;另一方面是采取供给方定价的方式能将数据产品运营权保留在供给方,使其能够以各种如限免、促销等方式运营数据,使得有价值的数据能够普惠更多的需求方。
而第二类数据即个人特征行为数据,由于能直接用于如个人征信、营销等商业用途,其价值相对性的波动会非常大,大到甚至连供给方都不能准确评估其市场价值的程度。因此,这类数据比较理想的定价方式是需求方定价,如在线广告数据平台Bluekai的定价方式就是采取数据竞拍即需求方定价的方式,价高者得,同时控制数据的供给数量,确保一份有价值的数据仅被一到两家客户所有。
个人特征及行为数据的鲜明特点是超乎想象的细分程度,数据需求方仅会对其中一小部分数据感兴趣,如上海的淘宝卖家一般只关心江浙一带的用户数据,使得供给方对千千万万的细分数据做定价变成了几乎不可能的任务。正如当初Google推出搜索引擎关键字广告时,根本不可能对几百上千万的各种关键字逐一定价出售,最有效的方式就是采取需求方定价,即关键字竞价形式,综合出价最高的广告主将赢得对应广告位的展示机会。
当然,为实现第二类数据交易的需求方定价,数据交易市场的规则设计是核心问题,另外还离不开的是数据产品化。在交易之前,数据知识发现应该由数据交易市场完成,即数据已经由数据交易市场以云计算的形式经过充分的处理与挖掘,由需求方直接竞价购买使用。
(三)对于未来数据交易市场的建议
目前得益于大数据这一迅猛的风口,在不同省市的政府与商界的推动下,各地数据交易中心如雨后春笋般成立。鉴于政策红利和对后续牌照发放的不确定性,先搭台后唱戏的策略实属无可厚非。正如前文所述,数据交易市场的核心定位是降低交易成本,无法具备这一能力的数据交易中心在长期上是注定要被市场淘汰的。
与挂牌相比,数据交易中心的运营是更为艰难的任务,世界上也许没有第二种商品的交易会像数据那样具备想象力和创造性了,对于数据交易中心的短期发展,有几个可供参考的建议。
(1)数据交易中心首先应该从不涉及个人隐私的统计与科研数据开始入手,着力促进这些数据的交易。
(2)数据交易中心需要具备专业的数据应用团队,帮助对接数据产品化问题。这个专业的团队在交易中承担“催化剂”的角色,撮合供需双方交易的顺利开展,以化解交易市场虽然发展了大量会员但交易量极低的尴尬。
(3)设计良好的制度框架,将数据供给方的角色从“出售者”转变为“数据长期运营者”,以维持交易市场的长期活跃,这是交易市场发展的根本。
(4)试错第二类数据的交易,也就是涉及个人用户,存在一定隐私保护问题的用户特征与行为数据。
对于数据交易中心的长期发展,在于找到一套成熟的方案,能够公平合理地交易蕴含着巨大商业价值的第二类数据,这是对于数据交易中心的终极考验,也异常困难,但倘若能做到,则未来的数据生活或许因此而改变。