前言
随着数字技术的发展,信息的使用和存储也越来越多,这使数据的体量、类型、密度和速度呈现量子级别的爆发式增长,人类社会也因此迈入大数据时代,并影响社会各个领域。大数据最重要的特点就是,数据成为一种资源和生产要素,信息的内涵已不仅仅是内容本身,而是各种各样的数据。这就要求传媒产业必须适应这种新的信息生产方式,生产、分析、解读数据,探索一条为用户提供分众化服务和体验的发展之路,这将成为未来传媒产业竞争的核心要素。影视产业作为传媒产业的一部分,理应顺应和融入这样的潮流中,成为大数据时代数据资源的使用者和受益者。当今世界,由数字化带来的媒介融合及全球化带来的媒介竞争的加剧,给影视产业的发展带来前所未有的挑战。随着新媒体表现出的对内容巨大的集成、分装和传播能力,传统影视产业的内容生产、存储、扩散、评估和处理模式优势逐渐呈现出弱态趋势,产业创新已经成为影视产业发展的必由之路,而对用户数据、内容数据、行为数据和渠道数据等数据类型的获取、存储、分析和运用将是整个产业创新发展的可行路径,从数据中寻找受众的个性化特征,进而为影视制作、内容传播及收视评估等提供方法论依据。
大数据把人们对因果关系的探究转向相关关系的探究,海量数据背后代表着事物与事物之间的相关联系。对因果关系的探究主要解决“为什么”,从现象到本质的线性主观性活动;而对于相关关系的探究则基于“是什么”,从现象与现象之间寻找相关关联,体现的是横向的客观性活动。就影视产业的发展而言,以往主要从现象中发现问题,进而解决问题;而通过大数据的运用可以从现象中寻找利益点,更好地指导影视产业的发展。当前影视产业市场已经呈现“马太效应”,而且随着媒体市场化程度的深入,这种趋势还在不断加强,未来处于金字塔塔基的影视产业主体数量越来越多,塔尖部分数量则越来越少。以省级卫视为例,强势省级卫视一档综艺节目的广告收入甚至可以超过弱势省级卫视一年的广告收入。随着媒介融合和媒介竞争的加剧,越来越多的电视频道将难以为继,这就意味着:在面临“存量”逐渐上移到金字塔塔尖的情况下,电视频道必须在“增量”上寻求新的利润增长点,改变以广告商为价值中心的媒介运营策略。而通过对大数据的应用能为这些电视频道多元化的“增量”提供解决方案:一是通过对大数据的分析运用,开发出直接面向用户的产品和服务;二是结合用户媒介消费行为习惯,将产业价值中心由原来的以上游广告商为中心的模式下移到以影视内容和版权分销为主的模式;三是利用大数据进行内容的精准推送和精准定位,开发产品和服务的最大价值和用户体验。例如,国内主流视频公司爱奇艺通过对用户媒介消费行为的数据分析筹拍了多部网络剧,广受好评。这些网络剧的成功正是基于大数据分析的基础,包括用户会在哪里暂停、回放、快进等,如果大量观众都在某一个节点做快进或者回放动作,爱奇艺就能判断用户喜欢或讨厌的桥段,并以此指导网络剧的生产。
在大数据背景下,包括广播电视运营商、互联网运营商和电信运营商在内的各影视产业主体之间的竞争将越来越激烈,广播电视运营商原有的优势地位将受到挑战。首先,在媒介竞争加剧的情况下,广播电视运营商的经营模式和经营效率存在不少问题。其次,互联网和电信企业占据技术上的优势,早已开始大数据的采取、挖掘和应用,针对不同地区、不同媒介消费结构的用户推出不同的媒介产品和服务,提高了ARPU值(运营商从用户获取的平均收入),而电视运营商还在通过粗放式经营,提供单一、同质的内容产品,一个可以佐证的现象是近年来电视开机率的下降和“客厅革命”的兴起。不仅如此,在大数据的影响下,产业法规、资本经营活动及技术开发模式都会发生重大变化,这些变化都会对产业发展提出新的挑战。从产业法规来看,在数据收集与获取过程中带来的隐私保护等新问题会对现有法律和规章制度提出挑战,同时不同地区、不同影视产业主体在大数据运用过程中带来的数字鸿沟问题也会进一步加剧;从资本经营活动来看,大数据运用必定会带来影视产业的专业化、细分化和精准化,同时也会有更多的产业资本参与其中,各类网络视频、手机视频、互联网电视、IPTV等形式层出不穷,而单一资本经营很难满足市场需求,多元化的资本经营必将会对现有经营模式和管理模式提出挑战;从技术开发角度来看,在三网融合的趋势下,大数据的获取必须结合广电网络、互联网络和数字交互平台,通过数据采集系统收集数量庞大的业务系统数据。而大数据的应用必须结合物联网技术、数字技术、广电技术,共同搭建云媒体平台,采用“一云多屏”战略,通过大数据智能分析系统将获取的数据应用于广告的精确定位、视频内容的精准推送、电视商务活动及大数据分析处理后产生的数据产品运用等。
影视产业大数据的获取与应用主要体现在对用户媒介消费行为的数据收集与处理上,在云计算的基础上进行分析预测,从而实现从内容生产到精准投放的全链条服务。
(一)大数据的获取
大数据运用过程中最显著的几个特点决定数据收集的重要作用:数据体量大、类型多、价值密度低、时效快,同时这也是大数据运用与传统数据运用的不同之处。因此,影视产业运营商真正步入大数据时代首先需要对数据采集工作进行改良。
首先,建立动态数据收集系统。在用户媒介消费行为的数据收集过程中,传统广电运营商可以通过数字机顶盒双向自动回传的方式进行海量数据的采集,还可以在用户按键上增加主动评价功能,或者播放过程中提示用户进行主动评价,或者通过互联网电视掌握用户行为。互联网电视不同于网络视频,它必须借助广电CDN网络,这也为广电运营商监测和收集用户数据提供了支持。网络视频运营商可以通过后台技术建立大数据收集系统,如通过App记录用户的每个行为,从而掌握每个用户的收视兴趣点。深化用户信息的统计分析,将原来同类化的用户数据依据不同属性特征进行细分分析,如年龄、性别、收入、受教育程度等属性,并建立动态化的数据采集系统,随时更新采集到的数据,保证数据的科学性。
其次,需要跨平台合作,扩大数据采集范围。大数据必须基于一定的数据体量,否则毫无意义。因此,在三网融合的基础上通过技术手段扩大用户行为数据的收集已是大势所趋。广电运营商也应改变传统的收视调查方式,传统电视收视率数据并非科学的大数据,以北京、上海等一线城市为例,收视调查样本户也不过800户,样本数量偏小使人们对调查结果的科学性产生质疑。如果以传统的收视调查方法作为标准,热门的影视剧(如《绝命毒师》《废柴联盟》等)根本无法面世,因为它们在尼尔森的收视率调查中分值很低,但却受到年轻网民的追捧。导致这种反差的原因就在于传统收视调查公司只专注于对传统电视机的调查,而对VOD点播、网络视频及其他增值业务数据缺乏关注。可喜的是,传统的收视调查公司已经意识到这点并开始行动,尼尔森在2013年第三季度开始监测电视剧网上点播收视率。而且,三网融合为扩大数据采集提供了技术基础,传统广电运营商不仅可以通过机顶盒回传收集数据,还可以通过广电网络回传收集如点播类增值业务数据,全方位、多角度掌握用户媒介消费偏好。网络视频企业也可以开创网台联动模式,借助传统广电网络实现节目精准营销,甚至可以联合电信运营商实现“跨平台、多媒体、多终端”的三屏联动模式。例如,爱奇艺公司和河南卫视自制的《汉字英雄》节目把互联网资源和传统广电资源整合,实现网台联播,并且与电信运营商合作,推出App,与手机移动端实现三屏联播。
(二)大数据的运用
数字采集只是大数据运用的前期准备,影视产业对大数据的运用还必须做到以下几个方面。
首先,做好数据清洗。数据清洗指的是把已获取的海量数据中的残缺数据、重复数据和错误数据剔除,以改善数据质量,净化数据挖掘空间。传统广电行业的收视率调查主要通过第三方收视调查公司完成,收视率造假问题大多通过收买样本户、截留数据或者直接篡改数据三种方式。而现有影视产业运营商对于大数据的分析与运用主要供自己企业使用,再加上获取的样本量的海量特点,主动造假的可能性很低。但避免不了被动造假,特别是由于样本偏差、样本污染和计算方法不科学导致的数据错误。例如,除了传统的电视以外,现有的计算机(PC)、智能手机和平板电脑都可以是接收终端,这两类接收终端存在明显不同。电视是家庭消费媒介,一台电视开机意味着有可能是几个观众,而PC、智能手机和平板电脑是个人消费媒介,一台智能手机和平板电脑一般只有一个观众。因此,电视所得到的媒介消费行为数据是以家庭为样本单位的,而PC、智能手机和平板电脑所反映的则是个体的媒介消费行为。如果把传统的电视受众和移动终端受众列入同一个样本量,就容易造成样本偏差。为了解决此类问题,还要做好后续的二次调查工作,把偏差样本数据剔除。
其次,做好数据挖掘。数据挖掘的积极意义在于通过海量样本及其真实性提高结果的有效性,传统广电企业的数据统计较为简单,主要是因为它们所得到的数据都是结构化的同质数据,统计比较容易。而随着大数据时代的到来,这些企业需要掌握的用户数据越来越多,并且大多数是非结构化的异质数据,如果依据传统的统计方法对这类数据进行统计很难完成,因此,需要建立数据挖掘系统,对现有海量数据进行分类集成、数据转化、数据规约等工作。网络视频企业播放一部网络剧,除了点播量、用户位置、用户观看行为等数据以外,还可以通过文本挖掘和Web挖掘的方式获取用户对该剧的评价,如在朋友圈讨论剧情发展、在论坛发表影评、聊演员的八卦、利用搜索引擎搜索该剧相关资料等。这些数据都是非结构化数据,需要网络视频企业从多个维度进行分类归纳,而非传统广电企业依据人口统计学固定分类。此外,还可以通过用户之前的浏览观看行为,用聚类分析预测用户媒介消费偏好,在用户接收终端上提示“根据你的观赏习惯为你推荐”等短语,实现精准推送。
大数据已经在内容和形式上对影视产业发展产生重要影响,其影响主要体现在如下方面。
(1)数据成为生产力,内容生产过程中将依据大数据分析结果。大数据能给影视产业发展带来新的视角,不仅是生产方式的变化,更重要的是思维方式的变化,影视产业将改变以往以制作商和生产商为主的生产模式,转而以用户为导向制作产品、提供服务。例如,电视新闻制作中已经出现“数据新闻学”,通过数据挖掘新闻点;在影视剧生产过程中已经出现通过对视频用户深度挖掘的作品,Netflix的《纸牌屋》就是代表性案例;在电视节目的编排上,依据不同时段的目标用户媒介消费特征设定不同栏目;在广告推送上,采用大数据分析对不同地区的不同用户在同一时段展现不同的广告内容;在移动终端,集合电视网、互联网和电信网推出新的类似“社交电视”之类的社交产品,进行个性化定制和智能化推荐。亚马逊已经着手把大数据运用到影视制作中,通过网络在几千份剧本中筛选数份剧本,然后将这数份剧本制作成样片,并全部在电视、网络中投放,并利用强大的数据分析能力观察用户的反应,最终决定投拍哪一部剧。通过这样的方式,影视剧的受众基础已经得到优化,舆论与口碑效应得以形成。
(2)现有收视评估体系将重新变革。现有的收视评估体系存在许多问题。第一,现有收视评估体系关注对象存在问题。现有收视率关注的是小样本电视媒体,许多如《绝命毒师》等在电视播放的影视节目虽然并不受电视用户欢迎但在网络中广受好评,而且还有许多只在网络播放的网络剧,通过传统的电视收视调查根本无法统计。随着越来越多的接收终端出现,现有收视评估方法根本无法完全统计。第二,现有收视评估体系调查方式存在问题。现有收视评估方法重点关注城市居民,采用的是小样本调查,无法反映整体,特别是对于人口众多的农村用户的调查十分欠缺,再加上商业利益驱使,收视率造假现已成为业界潜规则。第三,现有收视评估体系价值表达存在问题。现有收视评估体系关注的是观看率,反映的是节目内容的广告价值或经济价值,忽视了节目内容的文化价值与社会价值,一档恶俗的节目收视率可能会很高,但同时对社会的负面影响也会很大,这些负面效应在现有收视评估体系中是体现不出来的。
而随着大数据在影视产业中的运用,现有问题将在很大层面上能够得到解决。首先,大数据系统本身是一个跨媒体的平台系统,样本涵盖所有用户,能够准确收集每个用户的媒介消费行为,能够关注所有接收终端,不仅是传统的电视电影,还包括PC、智能移动终端等,从而解决了现在收视评估体系关注对象和调查方法存在的缺陷。其次,大数据能够把所有结构化数据和非结构化数据聚合分析。现有收视评估方式所得到的是结构化数据,还可以通过大数据获取类似文本数据、Web数据等非结构化数据,如用户观看过程中的停顿、跳跃动作,观看完的评价、搜索、剧情讨论及对于演员角色的关注等。通过以上两类数据的整合分析能够全面、客观地进行评估,解决现有收视评估体系中的价值表达缺陷。
(3)产业管理方式将发生变化。现有相关法律法规主要是对电影和电视的管理,如《电影管理条例》《广播电视管理条例》等,对于网络视频节目如网络自制剧的管理相对欠缺,随着大数据时代的到来,问题会更加凸显,特别是在个人隐私与信息安全方面,因此数据安全应成为大数据运用的前提基础。个别运营商不仅可以利用用户的观看行为采集媒介消费行为数据,甚至可以获取用户隐私信息。据外媒报道,智能设备在定位功能被关闭后还可以上传用户位置信息,甚至上传更隐秘的个人信息,如来往电邮、联系人名单等。对于很多网络视频运营企业来说,目前获取的所有用户数据还在有限的范围内,主要是用户休闲时的媒介消费行为数据,但如果政府部门不加强对大数据运用的管理,相信不久的将来,用户在任何时间和地理范围内的任何行为都可能被轻易获取。因此,政府管理部门加强这方面的管理势在必行。以美国为例,2011年,就有美国参议员提出《网络不跟踪法案》,2012年奥巴马政府公布《消费者隐私权利法案》,目的在于限制网络运营企业对用户数据的使用与传播,有很多影视企业和广告公司自发发起“不跟踪机制”。因此,健全的法律保障和管理方式的跟进是影视产业大数据运用的必要前提。
虽然大数据只是一种技术手段,不是解决一切问题的灵丹妙药,但我们也应认识到,大数据已经由技术热词转变为一种社会浪潮,对各个行业的发展产生重大而深远的影响,大数据的生成、处理和分析模式对影视产业而言是一种挑战,也是一种机遇,影视产业要创新发展就必须重视对大数据的运用。