数字经济时代的智慧城市与信息安全(第2版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.2 数字孪生城市的数据内涵特征与核心技术

3.2.1 数字孪生城市所需的数据类型

在数字孪生城市的构建过程中,城市的信息基础设施在提供信息服务功能的同时,也积累了海量的城市动态数据,这些数据种类繁多,难以尽述。在这里,我们对较为常用的城市数据类型进行简要的介绍。

1.地图与兴趣点数据

街道与建筑是城市的基本构架,地图数据是对城市构架进行描述的基本方式,而兴趣点(Point of Interest,POI)数据则是介绍城市各功能单元的基本信息。因此,城市地图数据和兴趣点数据是构建物理世界的数字孪生城市的基本数据,也是在对其他类型城市数据进行融合时的空间锚点数据。

2.GPS数据

安装有GPS接收芯片的移动设备可以收集城市中人、车等流动物体的活动信息。例如,目前应用比较广泛的浮动车技术就是在出租车、公交车等公共交通工具上安装GPS设备,将其作为传感器对于城市的交通情况进行采样。安装有GPS接收芯片的智能手机也可以当作个人行为轨迹的收集设备。但是由于隐私、安全等诸多问题,手机GPS数据很难大规模收集应用,目前只能依靠志愿者进行小范围收集和研究。

3.客流数据

城市中市民采用不同交通工具进行日常通勤的数据称为客流数据。出租车的客流数据可以使用浮动车GPS数据配合出租车计费表的乘客状态获得。公交车与地铁的客流数据则可以使用市政交通一卡通的刷卡记录进行收集。客流数据包含的城市活动信息非常丰富,可以被用于城区功能分析、人口流动监测、城市交通系统评估、多交通工具人类行为研究、城市交通经济学研究等领域。

4.手机数据

手机是人们日常生活必不可少的通信工具,其所能提供的数据类型很多,包括:通讯录、通话记录、GPS定位信息、与基站间的信令记录、上网记录和App使用记录等。这些数据可以反映城市中居民活动的兴趣偏好、活动范围、规模频率、社交关系等内容,因此具有非常巨大的应用潜力。

5.位置服务数据

位置服务(Location Based Services,LBS)是移动互联网时代一种新兴的网络服务方式,通过LBS应用所收集到的数据具有明确的地理位置坐标并兼具传统Web服务的语义特性。LBS数据是对POI数据的一种深度的描述和补充,与地图和POI等简单的城市地理数据相比,LBS数据包含大量的语义信息,可以帮助人们更加深刻地理解城市运行动态。

6.视频监控数据

视频监控技术已经被广泛地应用在交通管理、社区安保、室内安防、娱乐通信等城市生活的各个方面。视频监控设备所采集的海量视频数据记录着城市中居民生活的分分秒秒,在数字空间中形成了对物理城市的虚拟“映像”。充分利用这些视频数据可以从某种程度上再现城市生活的历史,具有巨大的理论研究与应用价值。

7.环境与气象数据

气象数据很早便受到城市科学研究的充分关注,近些年,随着人们对于环境与健康问题的日渐重视,以空气质量为代表的城市环境数据也开始成为人们关注的焦点。城市的环境与气象数据的一个重要的特点是其地理与时间采样密度低。如何实现细粒度、高精度的环境与天气数据收集和分析是该应用类数据的一个重要挑战。

8.社会活动数据

城市社会活动数据包括城市中的人口户籍、金融物价、医疗卫生、能源消耗等各种社会动态数据。社会活动数据是深入理解和分析城市社会化行为的基础信息。由于城市社会活动数据行业性较强,容易受到行业条块分割的影响,往往彼此分割孤立。打破行业条块分割、实现多源异构城市数据的融合,是深度利用城市社会活动数据所面临的首要任务。

3.2.2 数字孪生城市的数据特性

1.大数据特性

城市是人类活动最为密集的区域,海量的人类活动与社会运行数据不可避免地在城市当中爆发。以北京为例,每天有超过千万的市民出行,每天交通卡产生5000万条刷卡记录,有900万辆各类的车辆在运营,每天仅出租车GPS数据就会产生8000万条左右,同时有上万个交通固定检测器在采集车辆行驶状态信息,有近亿万条的手机通信数据,还有千亿级的交通影视影像数据。城市数据种类繁多,规模庞大,对数据的输入和处理速度要求也很高。城市数据包含的信息与知识极为丰富,对于推动人类认识的扩展与科学技术的进步有着巨大的价值,同时由于数据稀疏性的影响,城市数据的价值密度也很低。综上可以看出,城市数据完全符合大数据所具有的数据量巨大、数据变化快、多样性、价值高的特性。城市数据可谓大数据概念范畴当中的一个极具代表性的典型样本。

2.时空多维特性

以地图为基础的空间结构是城市数据的一种基本组织方式,而城市快节奏的生活方式也使得城市数据对于时间维度的变化非常敏感。因此,时空多维特性成为城市数据的另一个重要特点。在空间上,根据城市地理规模的不同,城市数据具有不同尺度的空间跨度。在时间上,根据产生的时间不同,城市数据具有事件相关的变化和分布。因此在进行城市数据分析和应用时,一方面需要考虑时间和空间两个维度的数据演化特性,另一方面还需要充分利用时间和空间不同维度之间的数据关联关系。这对城市数据的利用技术提出了很高的要求。

3.多尺度与多粒度

研究和利用城市数据除了要考虑时间和空间等多个维度之外,还需要考虑数据尺度和数据粒度对于数据特性的影响。在规模的尺度上,城市可以分为小型城市、中型城市、大型城市、超大型城市等;在地理尺度上,对于城市数据的描述可以小到几个街区或大到数千平方千米;在时间尺度上,城市数据的覆盖时间可以短到一些事件的监控,长到上百年的城市变迁。在地理采样粒度上,可以像遥感测绘数据一样精确到数米,也可以像气象环境数据一样以区县、地区,甚至省市为单位;在时间粒度上,更是根据数据采样设备的时钟、存储与传输能力、计算速度等因素产生不同的时间粒度,在时空多维度的条件下,高效处理多尺度与多粒度的海量数据,是有效利用城市数据所必须解决的核心技术问题之一。

4.多元与异构

如前文所述,城市数据具有非常多的类型与来源,即数据的多元性。这些不同来源的城市数据无论是从结构上、组织方式上,还是维度、尺度与粒度上都会存在巨大差异,即数据的异构性。智慧城市的应用需求要求我们必须对这些多元异构数据进行有机的融合,通过挖掘活化数据之间的相关性与相互作用方式来获取新知识。如何在一个统一的构架上分析异构性极强的多元数据,是构建物理世界的数字孪生城市面临的一项共同挑战。

从上述构建数字城市所需的数据类型和其特性的内容可以看出,现有工作对于城市数据的应用类型还非常有限。城市作为人类生活活动最为密集的场所,所产生的数据类型和数量都是难以尽数的,仅就现有的智慧城市研究与建设工作来看,我们对于城市数据的开发还远远不足,城市这座数据宝库中积累了无尽的数据资源,等待着我们进行深入的开发。

3.2.3 构建数字孪生城市所需的核心技术

1.数据感知技术

构建物理世界数字孪生城市的技术从顶层设计到具体的技术细节,均是以海量的城市数据作为核心支撑的,因此城市数据的感知与获取技术就成为数字城市建设的整体技术基础。传统的城市传感器技术在为不同的行业应用提供服务的同时,也直接或间接地收集到了大量的城市动态感知数据,这些数据使得现有的数字城市建设工作成为可能。然而传统的城市传感技术所采集的数据非常繁杂,难以统一和利用,我们在众多项目实践过程中,总结出了一整套多源异构数据采集、接入和整合的方法论,并形成技术研究成果,用于指导项目建设。该技术成果在构建数字孪生城市过程中,对有效整合利用传统传感技术产生的数据起到了至关重要的作用。

与此同时,随着移动互联网的兴起,人们可以随时随地地记录和分享自己的所见所闻,使得“以人为传感器”对城市进行感知的群体感知技术开始日渐兴起。例如,使用微博数据对2012年北京市“7·21暴雨”的积水点进行的检测,其结果与实际积水地点基本相符。目前,群体感知技术在智慧城市应用当中还只是传统数据获取方式的一种补充,相信在不久的将来,群体感知技术将会逐步走向前台,成为智慧城市应用的一项主要数据来源。

2.数据管理技术

海量城市数据的存储、管理与检索是一项非常具有挑战性的工作,已有的一些研究工作显示,分布式数据库、Hadoop等现有的数据管理方式尚无法完全满足智慧城市应用对于海量数据查询与管理的实时性和灵活性要求。造成该问题的根本原因在于,用于智慧城市应用的海量城市数据并非专门为建设智慧城市而收集(多为城市信息化和数据化过程中的信息基础设施),数据管理系统的设计者更多考虑的是其初始的数据应用需求,而没有对智慧城市应用做任何数据管理优化。同时城市计算等智慧城市技术在数据利用方面又有着异常广阔的想象空间,即便是智慧城市研究的专家也无法列举所有可能的应用模式。这就导致数据管理系统的设计者在开发系统时无法获知系统应用者的具体应用需求,从而引起数据管理系统与应用系统之间的不匹配,影响系统的整体性能。如何解决这一问题目前尚无非常成熟的技术方案和支撑理论。

3.数据挖掘技术

数据挖掘技术是大数据时代进行数据利用和知识发现的另一项核心关键技术,构建以数据为中心的智慧城市也必然需要数据挖掘技术的大力支持。我们具备业内先进的数据挖掘技术和丰富的数据挖掘实践经验,协助公安部、部分省公安厅、中央网络安全和信息化委员会办公室(以下简称网信办)等单位开发了大量的数据挖掘和分析模型,并实际应用于城市治理业务中。在该领域一个主要的挑战在于如何在海量多源的城市数据当中寻找适合具体应用的数据子集。例如,城市动态检测研究往往需要所使用的城市数据子集尽可能多地涵盖城市动态特性的各个方面,而具体的附加行业应用则要求数据所包含的信息尽可能单一纯粹。这些互斥性的数据需求给城市数据的收集、管理和挖掘都带来了巨大挑战。解决好数据子集的选择问题与子集间不同数据的融合问题,是在智慧城市领域进行数据挖掘研究的关键所在。

4.数据活化技术

数据活化(Data Vitalization)概念是由北京航空航天大学熊璋教授所提出的一种全新的数据管理与应用模式。数据活化也就是赋予数据生命的意思,数据活化技术的核心思想在于将真实物理世界中的数据内在联系映射到数据存储与管理的数字空间中,使存储空间中相互隔离的数据变为一个有机的整体,恢复数据在物理世界当中的关联性,并突破信息空间在进行数据利用时的局限性。数据活化体系结构采用“活化细胞”(Competent Cell)的数据进行组织。活化细胞作为数据组织和管理的最基本单元,一方面具有对数据的存储能力,另一方面也具有映射物理空间中数据联系与相互作用的计算能力。活化细胞在存储数据的同时,会根据实际应用的不同,不断地学习用户应用行为并对细胞中的数据进行重组织,使数据可以更好地适应多样化的用户需求。同时,当物理世界中数据描述对象发生变化时,活化细胞还可以通过自主演化的方式来改变数据的储存结构和内容,从而实现存储数据的代谢与演化过程。

数据活化技术非常适合追踪物理世界中的对象实体在数据空间中的映射演进过程,是处理海量城市数据、构建智慧城市的有力工具。科学家使用数据活化的思想设计了一种海量城市数据联网的数据组织工具,该工具可以对现有物联网数据进行活化组织,非常适合城市中海量物联网与传感器数据的管理。使用数据活化技术对监控视频数据进行结构化的描述,可以用以解决城市视频监控数据的高维度和非结构化问题。除此之外,数据活化技术也受到了工业界的密切关注,美国Bardess Group Ltd.公司基于数据活化技术开发了一种Data Revitalization的数据管理解决方案。该方案的数据管理架构共由五层组成,如图3-1所示,并且具有更新、学习和演进的能力,使用该架构可以有效地提高企业数据资产的整体管理质量。

图3-1 Data Revitalization解决方案数据管理架构

数据活化技术已经在智慧城市、视频数据分析、企业数据资产管理等数据密集型应用领域初步展示了其技术优势。使用数据活化技术对城市数据的组织与管理方式进行重构,从数据的底层结构开始实现数据的智慧化,将会是未来智慧城市技术研究的一个重要的发展方向。

5.数据可视化技术

智慧城市技术是一种与普通民众生活紧密结合的应用技术,友好亲切的服务呈现方式是其中必不可少的环节。数据可视化技术能够将纷繁复杂的城市数据以一种简洁有序的方式呈现给用户,可以很好地填补技术到用户之间的理解鸿沟。在城市数据应用的推动下,数据可视化必然会成为未来智慧城市技术体系当中至关重要的一环。

6.统计物理学理论

物理学是研究物质世界最基本结构、最普遍相互作用、最一般运动规律及所使用实验手段和思维方法的自然科学。基础物理理论对于工业应用技术的影响往往是变革性的。17世纪牛顿经典力学引发的工业革命、20世纪量子力学引发的新技术革命都是非常好的证明。进入21世纪之后,人类活动行为的基础理论研究成为统计物理学的一个新兴研究热点,复杂网络理论、人类活动时空动力学等研究成果不断涌现,这些成果必然会引发城市技术发展的巨大变革。在这样的大趋势下,谁能够更好地利用统计物理学的相关研究成果,谁就能够在日趋激烈的智慧城市技术竞争中占领先机。