刑事法前沿(第11卷)
上QQ阅读APP看书,第一时间看更新

三 犯罪治理活动中个人信息大数据的介入

个人信息大数据介入犯罪治理活动脱胎于社会生活的整体数字化、网络化。就具体的介入方式和所产生的影响而言,则其受制于大数据的基本特性。鉴于此,本部分从大数据的基本特性入手,基于其所引发的认知范式转化,进一步分析其在当今犯罪治理活动中的主要介入路径。

(一)认知范式转化背景下的大数据特性

当前有众多研究主要从数据量的角度来考察和评价大数据[48],但大数据的含义似乎又不尽如此。早在2008年,计算机社区联盟(Computing Community Consortium,简称CCC)就在其报告中提出了大数据的四个关键要素:探察(sense)、收集(collect)、存储(store)、分析(analyze)。[49]Atlantic Media 的主编康科尔(Frank Konkel)在2013年曾发表观点认为,无论如何定义大数据,这一概念都应当指向一种无法通过少量数据分析得出有效结论的研究分析方法,并且通过使用该方法,或者可以产生观察同一事物的新视角,或者产生新的价值形式。[50]从这个角度讲,大数据并非简单地指向规模化的数据量,而是具有认识论与方法论意义上的重要变革。在认知范式转化的语境下,大数据具有以下四个核心特性。

第一,大数据是行为而非行为客体。[51]仅存在超大体量的原始数据而不附加后续管理与分析处理,不能称之为大数据,至多只能称其为“大数据库”。大数据所呈现的事实或规律并非自始以完整形态存在,而是随着数据挖掘、分析的不断深入而逐渐成形。目前在刑事司法裁判领域出现的以“镶嵌论”(mosaic theory)为代表的事实认知模式,正是对大数据这一特性的直接映射。该理论认为,分散的数据碎片尽管对其占有人而言价值有限,但将这些碎片通过特定模型组合起来则会产生不可估量的整体价值。[52]

第二,大数据引发认知范式转化基于一个基本前提,即假设特定主体的行为或偏好存在相对稳定的模式或轨道。从该假设出发,大数据所做的是通过积累和分析海量的“数据足迹”以求发现目标对象的运行趋势,并以此为基础激活相应的解释、监控、预测、规划等机制。[53]这种假定存在某种行为模式并试图通过大量数据计算以发现该模式的思维模式,意味着传统意义上通过预先设定问题再进行数据分析的思路难以为继,取而代之的是将数据分析前置并在分析中逐渐发现问题的思维过程。[54]

第三,从格雷等人归纳出的四个范式出发,大数据采用的是“数据—理论模型—特定现象”的认知模式,即以数据挖掘作为分析起点,在此基础上概括出一般模型,最终以包括可视化在内等方式实现精准定位或服务。这与传统的“特定现象—理论模型—数据”认知模式形成逆转。数字革命对现实社会带来的核心影响之一就在于数字化成为数据分析的必然前置环节,而转化后的数据分析又进一步依托于相应的算法。以法学为例,无论是当前的计算法律学(computational law)[55]还是以区块链技术为基础的规则设计[56]等相关研究,均需要处理数字化与计算分析两个问题。

第四,大数据的后续应用目标与前期数据收集之间难以确保精准对应。就大数据而言,对半结构化或非结构化的数据的前期搜集和存储尤为关键,其中特别需要注意的是对动态数据和碎片数据的及时固定或实时处理。从另一个角度来看,这一特征也意味着数据处理过程中的数据噪音的增多,而数据分析最终需要回归适用于特定主体或情形,因此如何在即时性与精准性之间寻得平衡,是大数据对数据处理技术和应用带来的新挑战。

基于大数据的基本特性,以及由此形成的认知范式转化,犯罪治理活动也呈现一些新的变化,这些变化主要体现在两个方面:一是服务于刑事侦查活动的数据存留及共享义务开始大幅度扩张;二是以犯罪风险防控为指导的犯罪治理启动时点前移。

(二)服务于刑事诉讼的数据存留及共享义务的扩张

大数据的具体运用依赖于规模化的数据挖掘。数据碎片经由大规模搜集、重组、认知之后形成有效的信息,这一模式发挥效用的前提在于数据搜集活动的常规化、普遍化。基于此,个人信息大数据介入犯罪治理通常引发三种相互联系的制度设计:其一是明确特定主体的数据存留、监控、披露义务;其二是鉴于大规模数据搜集可能引发的与公民基本权利之间的冲突,以个人信息为客体的基本权利保障机制的设立;其三是为实现犯罪治理之目的,形成刑事司法领域公民个人信息保护的例外规定。[57]

以《中华人民共和国网络安全法》(下文简称《网络安全法》)为例。首先,《网络安全法》第24条明确了特定业务中网络运营者收集用户真实身份信息的义务;其次,基于个人信息保护之诉求,该法第40~45条就个人信息的收集、使用等行为设定了条件和边界;最后,为实现犯罪治理之目的,该法第28条进一步规定“网络运营者应当为公安机关、国家安全机关依法维护国家安全和侦查犯罪的活动提供技术支持和协助”。

由此可以看出,在大数据引发数据存留及披露义务一般化的大背景下,立法基于个人信息保护之目的而设置的限制性规定主要指向网络运营者等私主体。对于权力机关而言,只要符合法律规定的合理目的,在信息准入层面基本上不存在实质性障碍,其职责主要在于获取信息之后履行保密、保管、专用以及销毁等义务。

事实上,通过查阅相关规范性文件,可以看出权力机关之间以提升社会治理职能为目的的信息收集与共享平台正在逐步建立。例如根据国务院于2016年9月制定的《政务信息资源共享管理暂行办法》,各部门之间信息交流与共享的适用范围扩展至“政务部门直接或通过第三方依法采集的、依法授权管理的和因履行职责需要依托政务信息系统形成的信息资源等”(第2条)。2017年5月,国务院办公厅正式出台《政务信息系统整合共享实施方案》,与之对应的试点工作也已在2017年10月全面启动。结合2010年中纪委、中组部和中宣部联合发布的《关于建立和完善执行联动机制若干问题的意见》,2011年十五部委联合发布的《关于建立实名制信息快速查询协作执法机制的实施意见》,2014年最高人民法院、证监会联合发布的《关于加强信用信息共享及司法协助机制建设的通知》,2016年最高人民法院、公安部联合发布的《关于建立快速查询信息共享及网络执行查控协作工作机制的意见》等文件,可以更加清晰地看出国家权力机关之间信息共享的大趋势。在此规范框架下,数据仓库建设、联机分析以及数据挖掘形成一整套犯罪治理模型,并随着大数据的进一步推广,其很有可能在未来成为犯罪防控与侦破的核心手段。[58]

(三)基于风险防控的犯罪治理启动时点前移

个人信息大数据在犯罪治理领域引发的第二项重要变革在于,基于风险防控理念,犯罪治理活动的启动时点不断前移,一方面表现为以预测警务(predictive policing)为代表的一般犯罪防控,另一方面则体现为具体犯罪案件中侦查活动的提前启动。

首先来看预测警务。预测警务一般被定义为基于相关数据并采用量化分析等技术,协助警察识别犯罪风险并进行犯罪预防或犯罪治理等活动[59],主要包含以下三项特征:(1)以识别和预测犯罪风险为主要目的;(2)以大数据分析为主要模型;(3)预测结果将触发相应犯罪控制措施。

美国信息技术学者佩里(Walter Perry)等人在其2013年的研究报告中依据功能差异将预测警务区分为四种类型:预测犯罪活动(predicting crimes)、预测潜在犯罪人(predicting offenders)、预测犯罪人身份(predicting perpetrators' identities)、预测犯罪被害人(predicting victims of crimes)。[60]其中,“预测潜在犯罪人”和“预测犯罪人身份”均指向的是可能实施犯罪行为或具有犯罪嫌疑的特定个人,区别在于,前者用于预测已知个人未来可能实施的特定犯罪行为,后者则用于预测已知犯罪可能对应的有特定犯罪记录的个人。

无论基于何种模式,预测警务均要求执法人员以数据分析结果为依据,将特定公民与犯罪行为进行预判性匹配,并基于该预判采取针对特定个人的犯罪控制措施。在此基础上,犯罪地图技术(crime mapping)同步发展起来,即通过强化监控与数据分析形成特定地区的犯罪热点可视化地图,进而引导警力分配和公民日常活动。[61]通过将犯罪治理行为在时间轴上前移,预测警务被认为能有效提高犯罪防控效率,从而自1994年在美国纽约市警察部门开展的CompStat[62]犯罪控制项目起,逐渐在世界范围内被广泛应用。[63]

中国的犯罪治理同样关注到了预测警务的应用。2015年,中共中央办公厅和国务院办公厅联合印发了《关于加强社会治安防控体系建设的意见》,强调通过“强化信息资源深度整合应用,充分运用现代信息技术,增强主动预防和打击犯罪的能力”。基于该工作思路,各地纷纷开始建立或强化预测警务系统,例如北京市怀柔区的犯罪数据分析和趋势预测系统、江苏省苏州市的犯罪警情预测系统、四川省推动的“雪亮工程”公共安全视频监控建设联网应用、江西特殊人群大数据平台等。[64]

预测警务系统使得当地公安机关可以在犯罪高危地区提前布控,从而实现针对犯罪活动的高效、精准打击。目前国内通过大数据进行侦查主要集中为两种模式。第一种模式是预测犯罪高发区,典型的例子如江苏省苏州市自2013年起推行的犯罪警情预测系统,该系统收录了十年来苏州市1300余万条的警情数据和7.8亿条的商铺信息,为科学配置警力、提速应急反应奠定了技术基础。[65]第二种模式是数据比对预测犯罪嫌疑人,例如自21世纪初我国开始研发并逐步推广的全国公安机关DNA数据库应用系统,至2015年9月该数据库已经收录近4000万条DNA信息[66],成为个人信息比对和案件侦破的强大助力。

除日常化的预测警务外,犯罪治理活动启动时点前移还体现在具体案件的侦查活动中。从大数据的特性出发,对此可以从两个方面进行观察。首先,通过应用第三方数据记录、大型数据库、预测性分析等手段,刑事立案标准的实现方式可能发生重大转变。[67]我国目前刑事诉讼采用的立案标准仍是“有犯罪事实需要追究刑事责任”,问题的关键在于,基于公民个人信息大数据分析所做出的犯罪行为预测,能否用于犯罪事实补强或犯罪嫌疑人划定。

其次,具体案件中刑事侦查活动启动时点前移还体现在对立案前证据收集行为的效力确认。2012年《刑事诉讼法》专门在第52条中就行政执法过程中收集的物证、书证、视听资料、电子数据等非言词类证据在刑事诉讼中的证据资格进行了规定。沿着同一思路,2016年“两高一部”出台《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》(下文简称《电子数据规定》)明确规定初查过程中收集、提取的电子数据可以作为证据使用。2017年11月公开征求意见的《监察法(草案)》第34条更是将这种资格确认扩展至执纪执法中搜集的各类证据。

尽管以上规定在具体的资格确认方式方面仍然有待明确,但几份文件共同反映出刑事司法证据规则的一个发展趋势:基于大数据对于认知范式的转化,数据收集与分析前置于侦查人员对犯罪事实及刑事责任的认知将成为常态。正是基于此,龙宗智教授认为当前《电子数据规定》不可避免地造成强制侦查措施提前于立案行使的情形。[68]大数据在形成和应用过程中难免干预公民的个人信息,区别仅在于程度和所涉及的具体权利类型。这种先于立案而采取的犯罪治理措施无疑会对刑事司法的正当程序原则构成挑战。