您好, 访客   登录/注册

基于区块链的可验证医疗数据统计方案

来源:用户上传      作者:

  摘   要:目前,数据统计广泛应用于社会经济生活的各个方面,对医疗数据进行统计已成为医院工作不可或缺的环节,然而传统的方法存在数据篡改、信息泄露的风险。文章基于区块链技术,提出了一种新型的医疗数据统计方案,利用区块链的不可篡改性,有效避免了数据篡改的风险;使用同态加密和保序加密算法,实现链上数据的隐私保护;利用智能合约一方面对密文进行统计,确保统计结果的正确性;另一方面,实现在密文状态下的数据排序。若某机构对排序结果存在异议,可向监管机构提出申请,监管机构通过解密链上数据进行结果审查,并将审查结果返回,实现结果可验证。
  关键词:区块链;同态加密;保序加密;智能合约
  中圖分类号:TP309          文献标识码:A
  Abstract: Data statistics work involves various aspects of socioeconomic activities nowadays, and the statistics of medical data has become an indispensable part of hospital work. While the traditional methods have the risk of data tampering and information leakage. Based on the blockchain technology, a new data statistical scheme is proposed in this paper. The non temperability of blockchain is utilized to effectively avoid the risk of data tampering. Homomorphic encryption algorithm is used to achieve the privacy protection of data on the chain. At the same time, the ciphertext is counted regularly by using the smart contract to ensure the correctness of the statistical results. On the other hand, the statistical results are encrypted with order preserving to achieve data sorting in ciphertext state. When an institution has any objection to the ranking results, it can apply to the supervisory authority, which will review the results by decrypting the data on the chain and return the review results, so that the results can be verified.
  Key words: blockchain; homomorphic encryption; order-preserving encryption(OPE); smart contract
  1 引言
  统计是通过数字来揭露事务在一定时间内的数据变化规律,可有效帮助人们对事务进行定量分析,从而促进人们做出正确的决策[1]。大到对国家GDP、人口数据的统计,小到对学生成绩统计,数据统计已涉及到社会、文化、国民经济、人民生活等各个领域,通过统计可以实现对不同事务进行有联系的定性分析。
  数据统计作为经济信息的重要组成部分,在社会经济中发挥着极其重要的作用,准确无误的统计结果是检测社会经济活动规律的重要指标之一,是进行科学决策和管理的重要依据。然而目前数据统计采集仍然存在较大问题:一是统计基础工作薄弱,统计工作人员对原始数据记录混乱、拼凑数据、数据逻辑性错误等,极大影响了后期整理难度,降低了数据的真实性和有效性;二是报表人责任意识弱,工作敷衍不严谨,对统计数据来源不能严格审查,严重影响统计数据质量;三是缺乏有效评估和监督机制,部分统计部门为了局部利益会对统计工作进行行政干预,纵容统计数据作假,数据统计不透明,很难确保统计结果的准确性[2]。
  在现代化医疗体系结构中,每个病患在就诊过程中会产生大量的电子医疗记录,其中包括患者的个人信息、病历及各项检查数据等。这些记录通常会传送到医疗的云服务器中存储,这不仅给病历数据的统计带来便利,也节省了大量医生手写病历的时间。高效准确的医疗数据统计以及统计数据价值的有效流通,给医疗机构科学决策和科学管理提供了可靠的数据依据[3]。然而在统计过程中,一方面因大多数医院信息化技术人员水平不一,导致统计结果的正确性相差较大[4];另一方面各医院相互独立进行统计工作,存在数据易篡改问题,而且无法实现统计数据共享。因此,亟需改善现有统计方案,增强数据统计的正确性和可共享性。
  比特币[5]市值的一路增长,其底层区块链技术也得到政府、企业和学术界高度的重视。我国也相继出台了许多关于区块链的发展政策。2016年,《关于印发“十三五”国家信息化规划的通知》[6]中,首次将区块链作为一项战略性前沿技术、颠覆性技术。2017年,国内多省份、直辖市均出台了针对区块链产业发展的相关指导意见和区块链专项扶持政策,加快了各地区块链的发展步伐。2018年10月8日,海南省工信厅正式授牌海南生态软件园设立“海南自贸区(港)区块链试验区”,该试验区是国内首个正式授牌的区块链试验区。   区块链作为一种新型分布式数据库存储技术,具有开放性、可追溯、不可篡改等特性,对于解决数据统计面临的数据易篡改、结果不准确等问题有着天然优势。然而链上数据具有高度透明性,为了保证链上数据的隐私性,有必要在数据上链前进行加密处理,且需要采用一定的技术完成对链上数据的匿名操作。
  保序加密(Order Preserving Encryption,OPE)于2004年由Agrawal等人[7]首次提出,该加密方案使得密文与明文保持相同的顺序,可以实现在不透露任何明文信息的情况下,直接对密文进行查询操作,且达到与明文查询相同的效率,能够很好保护用户数据的隐私。保序加密分为一对一保序加密和一对多保序加密。前者指相同的明文加密得到相同的密文,后者指同一个明文可能得到不同的密文。Boldyreva等人[8]引入了保序明文不可区分的安全性定义(Indistinguishability under Ordered Chosen Plaintext Attack,IND-OCPA),并证明该保序加密密文是线性增长的,故不能够达到理想安全性的目的。后提出选择密文攻击下伪随机保序函数(Pseudorandom Order-Preserving Function under Chosen Ciphertext Attack, POPF-CCA),并提出相应的保序加密方案。Popa等人[9]提出一种新型的保序加密算法(mOPE),该方案实现了理想的IND-OCPA安全。Florian Kerschbaum[10]提出了一种隐藏频率的保序加密方案,通过随机化密文来隐藏明文的频率,在保证信息机密性的同时增强了密文安全性。
  本文针对目前存在的数据统计中易篡改、易泄露等问题,提出了基于区块链技术的可验证数据统计方案,使用区块链降低第三方信任机构的约束,增强了数据透明性,同時很好的抵御了数据被篡改的可能。采用同态加密和保序加密实现对链上数据的隐私保护。利用智能合约自动完成对数据的匿名统计和排序,当某机构对排序结果存在异议时,可通过监管机构验证结果的正确性。
  2 预备知识
  2.1 保序加密
  保序加密保证了密文与明文顺序的一致性,现多用于对云环境下的数据库数据机密性保护,可以高效处理涉及加密数据排序和范围查询。保序加密方案一般包含三个算法,记作一个三元组(GenKey,Enc,Dec),其明文空间设为D,密文空间设为R。
  2.3 区块链概述
  区块链是比特币的底层技术,具有匿名性、不可篡改、开放性等特点。区块链系统中每一个节点地位平等,不存在第三方的约束控制,两个互不信任的双方,无需第三方,可以直接点对点进行交易,且交易双方并无法获得对方的真实身份,很好的保护了用户的身份隐私。区块链是根据时间顺序将每个数据区块相连形成的链式结构,时间戳和链式结构的特性增加了链上数据被篡改的难度。区块链上数据是公开透明的,任何人都能够查看区块链上数据。
  区块链的数据结构如图1所示。其中包含区块头和区块体两部分,区块头中有前一区块的哈希值、时间戳、随机数、Merkle树根等信息,每个区块都保存有前一区块的哈希值,从而实现向前链接形成链式结构,使得链上数据具有可追溯性。
  区块链的发展历史可以分为三个阶段:区块链1.0、区块链2.0、区块链3.0。区块链1.0-可编辑货币是以比特币为代表的加密数字货币,相继出现一系列加密货币,如以太币(ETH)、瑞波币(XRP)、莱特币(LTC)、未来币(NXT)等。而数字货币大多用在转账、支付等方面。区块链2.0-可编程金融:单单的数字货币已经没法满足社会发展的需求,2013年12月,Vitalik Buterin发表“以太项目”白皮书[12],首次将近乎图灵完备的智能合约运用到区块链中,智能合约的提出使得区块链可以运用到除数字货币外的更多领域。区块链3.0-可编程社会:近年来,随着区块链技术的发展,区块链已被运用到各个行业(政府、文化、医疗、审计、物联网等),也在不断地改变着生活。
  2.4 智能合约
  2013年末,以太坊[12]平台首次将智能合约(Smart contract)运用到公有区块链上,任何人都可以去创建合约和去中心化应用。智能合约可以看成一段在区块链中自动执行的用户定义的程序。在以太坊中,智能合约在以太虚拟机(EVM)中执行,合约由多人共同部署,一旦部署成功,合约内容将无法修改,当满足某种条件时,合约会被激活自动执行,且不会受到人为的干预,最后将运行结果返回给用户。使用智能合约无法修改、自动执行的特性,可以用来代替可信第三方完成数据统计,确保统计结果的准确性。
  智能合约的出现,极大的增加了区块链技术的应用领域。如果说区块链提供了一种可信的数据,那么区块链上的智能合约就提供了一种可信的计算。在金融应用中,智能合约可以自动处理付款交易过程,如针对保险业务,可以在某种情况下自动支付用户赔偿金,能够有效消除骗保等问题。在公证领域,智能合约利用区块链数据的不可篡改性,可对知识产权进行存在性证明。在物联网领域,智能合约的加入,可以自动执行复杂的多步骤流程,从而可以节省大量的成本与时间[13]。
  3 基于区块链的可验证医疗数据统计方案
  3.1系统模型
  本文针对数据统计不透明,易篡改等问题,提出了一种基于区块链技术的可验证医疗数据统计方案。该方案中包括几个实体:授权机构CA、医院Hos、智能合约SC、监管机构SA。
  授权机构CA:验证机构身份,并颁发认证证书以及密钥。
  医院Hos:指拥有数据的链上机构。为了保护数据的隐私性,各医疗机构使用加密算法对数据进行加密处理后上传至区块链。
  智能合约SC:链上智能合约对链上数据进行密文统计,在不泄露数据明文的情况下,对数据密文进行排序处理,并将排序结果公布上链。   监管机构SA:对链上数据进行审查监管,并不参与统计过程,只是在出现问题的时候,可以解密所有链上数据,快速解决问题。
  3.2 具体构造
  本节以医院病患数据统计为例,具体考虑医院门诊、出院、入院人数的统计,详细介绍基于区块链技术的医疗数据统计方案。为了增强数据统计的科学性和客观性,同时保护医院数据隐私,本文提出基于区块链的可验证医疗数据统计方案,方案流程图如图3所示。
  (1)系统初始化
  设统计病历类型type={opc,admission,discharged},其中opc代表门诊,admission代表入院,discharge代表出院。随机选取素数p,q,且gcd(pq,(p-1)(q-1))=1,设置。
  (2)注册
  医院向授权机构CA注册认证,获得认证后,CA机构向医院分发自身编号,同态加密公私钥,,,保序加密密钥sk,并同意加入联盟链。如图4所示,为医院注册流程图。
  (1)数据加密上传
  各科室医生将患者病历发送给所在医院管理部门,每天的同一时间,管理人员从中提取出各科室病例中各个类型所对应的人数,并统计出该医院每天的门诊、入院、出院人数,使用医院公钥对病例中各个类型所对应的人数分别同态加密得, ,,医院私钥对各密文签名得,将医院编号、病例类型type和各密文一起上传至联盟链上,链上机构验证签名的有效性后,将数据上链。每月各医院将相关数据进行汇总后得到,使用保序加密算法对汇总结果加密,,,签名上传至联盟链。如图5所示,为病例数为病历数据上传。
  (2)定期数据统计
  智能合约每月统计链上各医院的门诊人数、入院人数、出院人数信息(,),利用加法同态加密的特性,通过计算,,可以在密文下实现对人数的统计,运行保序加密排序函数,对密文数据排序,最后将排序结果公布上链。
  在统计过程中,可以实现在不泄露各医院信息的情况下,对相关数据做出统计。并对各医院数据进行匿名排序,排序结果公布上链。若链上某医院对排序结果提出异议,可以向监管机构提出验证需求。监管机构对相关数据进行解密并返回给医院。医院、用户均可以通过客户端查看统计信息。用户可以很直观的看到各个医院相关数据的对比,从而根据自身需求客观的做出选择。医院也可以从这些数据对比中看到自身的不足,其为医院的管理决策提供了科学客观的数据。如图6所示,为智能合约执行的流程图。
  4 方案分析
  4.1方案的正确性分析
  所有待统计数据均是各医院经过Paillier同态加密处理后上传至联盟链上,尽管链上数据是公开透明的,但所有人都只能查看到链上密文信息。并使用区块链上的智能合约定期进行各医院门诊、入院、出院和死亡人数进行统计。智能合约所执行的代码在链上公布,任何人都可对链上合约功能正确性进行审计。智能合约利用同态加密的特性,可直接在密文下对医院各人数进行加法统计。因为智能合约一旦部署将无法修改,所以在代码正确时可以实现对链上数据的正确统计,而不需要受到第三方机构的牵制。
  4.2 方案的可验证性分析
  由于区块链的不可篡改性,可以有效避免第三方统计机构私自篡改数据的风险。各医院每月将相关数据汇总保序加密后上链,智能合约在不暴露明文的情况下,对各医院的相关人数进行对比排序,并将最后的排序结果公布上链。在监管机构安全可信的情况下,该方案满足排序结果的可验证性。若某医院对排序结果存在意义,可通过客户端发出审查请求,监管机构通过解密相关数据进行审查结果的正确性,并将审查结果返还给客户端。
  5 结束语
  随着科学技术的不断完善,越来越多的领域开始实现数字化建设,这在给数据统计工作带来便利的同时,也存在着数据录入不完整、易篡改等问题,这增加了统计结果的误差。为了更好的提升数据统计结果的科学性和正确性,本文提出了一种基于区块链的可验证元数据统计方案。利用保序加密,在不暴露统计数据的隐私情况下完成统计结果排序。由于区块链的不可篡改性,很好的保障了统计数据的真实可靠性,實现了统计结果的价值共享,并为相关机构的后续决策提供了客观可靠的数据支撑。
  基金项目:
  1.海南省自然科学基金面上项目(项目编号:619QN193);
  2.国家自然科学基金(项目编号:61661019);
  3.国家自然科学基金联合基金重点项目(项目编号:U19B2044);
  4.海南省高等学校教育教学改革研究重点资助项目(项目编号:Hnjg2017ZD-1)。
  参考文献
  [1] 张智勇. 浅谈提高统计数据质量的措施[J]. 同煤科技, 2010, (04): 45-46.
  [2] 杨秀月. 提高统计数据质量的措施[J]. 统计与决策, 2005, (01): 48-49.
  [3] 尹德静. 大数据时代医院统计工作的新策略分析[J]. 中国卫生产业, 2018, 15(31): 158-159+162.
  [4] 刘泽龙. 医疗大数据时代医院病案统计及管理探究[J]. 中国卫生产业, 2018, 15(21): 158-160.
  [5] Bitcoin: a peer-to-peer electronic cash system[EB/OL]. https://bitcoin.org/bitcoin.pdf.
  [6] 国发. 国务院关于印发“十三五”国家信息化规划的通知. 国务院, 2016.
  [7] Agrawal R, Kiernan J, Srikant R, et al. Order preserving encryption for numeric data[C]. Proceedings of the 2004 ACM SIGMOD international conference on Management of data, 2004: 563-574.   [8] Boldyreva A, Chenette N, Lee Y, et al. Order-preserving symmetric encryption[C]. Annual International Conference on the Theory and Applications of Cryptographic Techniques, 2009: 224-241.
  [9] Popa R A, Li F H, Zeldovich N. An ideal-security protocol for order-preserving encoding[C]. Proceedings of the 34th  IEEE Symposium on Security and Privacy(S&P), 2013: 463-477.
  [10] Kerschbaum F. Frequency-hiding order-preserving encryption[C]. Proceedings of the 22nd ACM SIGSAC Conference on Computer and Communications Security, 2015: 656-667.
  [11] Paillier P. Public-key cryptosystems based on composite degree residuosity classes[C]. International Conference on the Theory and Applications of Cryptographic Techniques(EUROCRYPT), 1999: 223-238.
  [12] Ethereum White Paper. A next-generation smart contract and decentralized application platform[EB/OL]. https://github.com/ethereum/wiki/wiki/WhitePaper.
  [13] Christidis K, Devetsikiotis M. Blockchains and Smart Contracts for the Internet of Things[J]. IEEE Access, 2016, 4: 2292-2303.
转载注明来源:https://www.xzbu.com/1/view-15129458.htm