区块链+医疗:新技术赋能医疗的应用与未来
上QQ阅读APP看书,第一时间看更新

2.2 分布式存储保证数据的一致性

区块链的结构本质上是一个按照时间顺序串联起来的事件链,创世块以后的所有交易都记录在区块中。交易记录等账目信息会被打包成一个个的区块并进行加密,同时盖上时间戳,所有区块按时间戳顺序连接成一个总账本。

区块链使用了协议规定的密码机制进行认证,保证不会被篡改和伪造,因此任何交易双方之间的价值交换活动都是可以被追踪和查询到的。

如果有人想要在区块链中修改“账本记录”,需要把整个链条上的加密数据进行破解和修改,其难度相当大,这是由区块链的结构所决定的。另一个保证安全的因素就是区块链采用了分布式存储的方式。也就是说,即使篡改者破解和修改了一个节点上的信息,也没有什么用,他需要同时修改网络上超过半数的系统节点数据才能真正地篡改数据。这种篡改的代价极高,几乎不可能完成,这也就保证了区块链的安全性。

分布式存储是去中心化的主因

那么,什么是分布式存储?通常的数据存储方式叫中心式存储,将重要数据都存储在一个中心服务器上,其他客户端都是从中心存储数据池中读取数据。区块链技术是将数据分散存储到全网络多个数据节点上,每一个节点都有完整的数据存储和备份,形成了一个大规模的存储资源池。分布式存储的数据传输和保存路径如图2-6所示。

图2-6 分布式存储的数据传输和保存路径

区块链构建了一个分布式结构的网络系统来保证数据库的严谨性。区块链设计者没有为专业的账本记录者预留一个特定的中心位置和中心权限,而是希望通过自愿原则来建立一套人人都可以参与记录信息的分布式记账体系,从而将会计责任分散化。数据库中的所有数据都实时更新并存放于所有参与记录的网络节点中。这样即使部分节点损坏或被黑客攻击,也不会影响整个数据库的数据记录与信息更新。

“分布式”概念最早出现在20世纪90年代。当时有不少大型的科学计算项目采用了分布式计算(Distributed Computing)设计,比如寻找外星人的Seti@Home和计算蛋白质折叠的Folding@Home项目。这些计算程序的计算量非常庞大,以往的中心式计算需要在超级计算机上完成,耗时长、费用高;而分布式计算是将这些计算项目中的部分数据分解,然后通过因特网将数据分配到安装了计算客户端的个人计算机上,利用闲置的计算资源共同来完成计算。

计算和存储,都是计算机的重要功能。分布式计算解决了数据的计算成本问题,大家一起帮忙计算;分布式存储解决了数据的安全性问题,大家一起帮忙记账。

在区块链出现之前,普通用户也曾经接触过分布式存储应用,那就是BitTorrent。BT下载所需的数据都分布在用户的计算机里,采用P2P的数据传输方式。音乐、软件、影视资源通过BT软件实现个人之间的免费分享,在用户之间进行分布式点对点传输。由于没有中心化的服务器,数据都存储在用户的个人计算机中,版权拥有者并没有办法将侵权数据移除。区块链技术也采用了类似的数据存储方式。

区块链的存储方式和BT下载的原理类似。根据BT下载的协议,文件发布者发布的文件生成种子文件,包含跟踪信息和文件信息两部分。BT下载一开始,首先要连接到中心的跟踪服务器获得其他用户的IP地址,然后连接到其他用户开始点对点下载。

每个节点都是平等关系

区块链构建了一整套协议机制,让全网每一个节点在参与记录的同时也来验证其他节点记录结果的正确性。只有当全网大部分节点(或甚至所有节点)都同时认为这个记录正确时,或者所有参与记录的节点都进行结果比对并一致通过后,记录的真实性才能得到全网认可,记录数据才允许被写入区块中。

区块链技术采用分布式数据存储的方式来解决账本的容灾问题,同时建立了一种个体之间的对等关系(P2P),形成去中心化的数据系统。这个系统中没有中心机构,所有节点的权利和义务都一样,任一节点停止工作都不会影响系统整体的运行。所以,分布式存储的一个优势就是“去中心化”。

从去中心化到弱中心化

区块链的核心不是去中心化,而是分布式。区块链的早期技术(如比特币)被描述为完全去中心化的技术。实际上区块链技术还是有中心的,虽然没有第三方平台作为中心,用信用背书,但实际上交易协议、算法就是它的中心。未来,区块链技术要在“原本只有少量的大中心”的行业中实现应用,还将慢慢演化成“有大量的更小规模的中心”。

去中心化带来的好处是降低信任成本,但P2P的多节点确认模式同时也会降低交易效率。由于金融行业的特殊性质,完全去除监管部门的监督权利是不切实际的,包括央行在内的多家监管机构也在研究如何在区块链中引入超级账户,通过超级账户执行一些特定的操作,包括交易账号的冻结等。

在实际中,很多业务场景已经有了一定的信任基础。比如一个机构内部,行业联盟之间的互信。在原有的信任基础之上,区块链朝着联盟链、私有链的方向发展。未来,区块链系统架构是可信任的多中心体系,将分散独立的各自单中心,提升为多方参与的统一多中心,从而提高信任传递效率,降低交易成本,即在信息不对称、不确定的环境下,建立满足各种活动赖以发生、发展的“信任”生态体系。

医疗健康记录的分布式存储

金融、法律、医疗保健和其他类型的交易有一些共同的要求,如有必要确定交易各方的身份,保持各方间的信任,确保交易记录正确、不能变更,保证交易发生的基础设施稳定。在区块链技术出现之前,实现这些目标的唯一途径是建立一个强有力的中心化角色来提供这些服务,如银行、政府和清算机构。

在医疗健康档案领域,每个医院或卫生系统都拥有自己的中心机构来提供记录、保存和传输健康档案的服务。传统的中心式存储设施是解决这个问题的最佳办法。虽然它有许多优点,但也有缺点。中心式存储容易遭受数据丢失、更改和攻击。这种架构的存在,也导致当今在医疗保健领域普遍存在的信息孤岛现象。

来自美国卫生与公众服务部的数据显示,2015年,黑客/IT事件导致了1.12亿条医疗记录数据遭到破坏或泄露。2016年,估计1/3的患者将成为数据泄露的受害者。而区块链的公钥/私钥访问方式和分布式数据存储为医疗保健信息的安全建立了一个新的范式。

以医院信息系统(HIS)的数据存储方式为例,它采用传统的中心式存储方式,数据全部存储在整个系统的数据中心上。而各科室的计算机是客户端,只负责数据的采集、录入和查询,不负责数据的存储。如果采用分布式存储,那么就不再会有中心服务器的存在,所有的客户端计算机都会充当数据服务器,把数据存储在本机上,所有节点以P2P方式进行数据传输。

不可更改是区块链技术的本质之一,但在实际应用中,特别是私有链中,当出现错误信息时,很多时候还是需要进行数据的更改。医疗保健机构可以保留患者电子病历的更新副本,分布式存储可以保护副本免受恶意攻击。如果出现患者性别错误或者年龄错误,需要调整区块链中的历史数据区块,则需要区块链的所有参与者达成一致共识,或者51%的网络参与者批准更改。如果确实发生了区块替换,那么这个区块将会留下一个所有参与者都能看到的更改痕迹。此功能可提高安全性,并可帮助降低恶意更改的风险,一旦更改会立即向网络广播。

咨询服务业巨头埃森哲(Accenture)已在欧美地区获得可编辑区块链模型的专利。此种区块链允许在已授权的区块链系统中,由中央管理员修改及删除储存信息。区块链技术的部分支持者认为,可编辑区块链颠覆了区块链原有的概念,是一种技术上的倒退。