隐私计算与区块链技术融合研究报告
(报告出品方/作者:隐私计算联盟)
第一章 背景
数据要素市场化已成为我国新一轮数字科技革命和产业变革的焦点。聚合多维海量数据,充分挖掘和利用其内在价值,是各个产业机构的战略重点。数据要素市场化发展的关键环节,在于能否打破数据孤岛,解决数据权属模糊问题,推动安全、可信的数据共享及价值流转,最大化挖掘数据的生产要素价值。近年来, 隐私计算和区块链技术逐渐成熟并快速普及,促进数据要素安全流通,为激活数 据要素市场流动性提供了安全可靠的解决方案。
第一节 数据流通政策进展
数据开放与流通是各国数字经济发展的核心要点
数字经济在各产业领域带来的效率增长和产出增加已成为推动经济发展的 主引擎。近年来,各国密集出台相应政策大力支持数字经济发展,核心都着眼于 更加安全的数据流通和开放。
美国于 2018 年-2019 年先后发布了《数据科学战略计划》、《美国国家网络战略》和《联邦数据战略与 2020 年行动计划》等相关国家战略规划,明确提出促进数字经济发展的相关内容,以及将数据作为战略资源开发的目标,并通过建 立执行机制和管理体系确保数据开放落实。
英国是政府数据开放共享程度较高的国家之一,具有较为完善的数据开放政策法规体系,推出了《数字经济战略(2015-2018)》、《英国数字战略》等战略计划,旨在通过数字化创新来驱动社会经济发展,并确立把英国建设成为数字化强国的方向。
欧盟主要是在政策层面寻求各成员国的统一,以便利数据在欧盟内部的流通, 并建立真正的欧洲单一数据市场。2020 年初欧盟发布了《欧洲数据战略》,年底 发布《数据治理法》、《数据市场法》、《数据服务法》等草案,体现了欧盟对内促进数据流通共享的一系列举措。
另外,德国、日本、东南亚等国家也陆续推出了数据开放的相关战略规划, 以大力促进数据流通的发展。
我国先后发布一系列鼓励数字经济的政策规划,并多次将数字经济写入政府工作报告。同时在“十四五规划”中提出,要发展数字经济,推进数字产业化和 产业数字化,推动数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。
首次明确数据是一种生产要素。2020 年 4 月发布的《关于构建更完善的要素市场化配置体质机制的意见》中,明确提出要加快培育数据要素市场,成为推动数据要素市场构建的重要指导。
安全合规的数据流通是数据要素市场健康发展的前提
随着数字经济的不断发展,由数据共享带来的数据滥用、盗用等不良现象层出不穷。相应的监管要求也在不断优化与加强,旨在营造公平公正、健康稳定的市场环境,完善数据的流通规则,确保数据安全有序被利用。
欧盟于 2018 年出台了《通用数据保护条例(GDPR)》,成为全球个人数据安全立法中极具标志性的一部法案。GDPR 赋予了数据主体同意权、访问权、更正权、被遗忘权、限制处理权、拒绝权及自动化自决权等规范数据权利。但也要 看到,欧盟在 2020 年发布的各项数据战略中,也深刻反思了 GDPR 带来高昂合 规成本对数字经济带来的伤害和限制。
美国各州对个人数据进行分散立法。被称为美国“最严厉、最全面的个人隐私保护法案”《加利福尼亚消费者隐私法案》(CCPA),规定了新的消费者权利,涉及企业收集的个人信息的访问、删除和共享,旨在加强消费者隐私权和数 据安全保护。但同严苛的 GDPR 不同,CCPA 针对个人数据利用问题显得更为开 放,更强调市场的自我调节。
日本以专项保护法律为核心,同其他法律共同构成个人数据法律体系。日本 《个人信息保护法》就个人数据的正当处理,对其基本理念、政府制定的基本方 针以及其他个人信息保护措施的基本事项作出规定,对国家及地方公共团体的职 责等予以明确。
我国在《民法典》、《数据安全法》、《网络安全法》、《数据保护法》、 《个人信息保护法(草案)》中,以各种形式规定了数据使用合法合规的有关准 则和规范,安全的数据流通逐渐成各级政府和广大民众关注的重点。随着政策法规不断完善,数据野蛮使用和随意共享的时代已经落幕。要使数据要素在合法合规、保证各方权益的前提下有序流通,需要明确数据要素流通的价值,探索数据要素流通的可行模式,构建保障各方主体权益的规范性制度,对于加快培育数据 要素的流通配置体制有着重要的现实意义。
隐私计算及区块链是数据安全流通的关键技术
数据安全流通需要制度和技术双管齐下,传统的数据共享手段难以适配跨 机构数据共享的旺盛需求和日趋严格的数据合规要求。多源异构的大数据时代需 要更丰富、更安全、更具适用性的技术手段。如何打破数据孤岛桎梏、确保数据 安全有序被利用、实现数据价值最大化,是数字经济发展中亟待解决的问题。隐 私计算技术和区块链技术的融合为此提供了很好的解决方案。
隐私计算是一套包含密码学、数据科学、人工智能、安全硬件等众多领域 交叉融合的跨学科技术体系,以保护数据全生命周期隐私安全为基础,实现对数据处于加密状态或非透明状态下的计算和分析,从而达到促进数据要素流通融合、 有效提取数据要素价值的目标。在保证各方原始数据安全隐私性的同时,完成对 多方数据的融合计算,实现多方数据的“可用不可见”。然而,数据的真实性、 数据来源、数据确权及流转过程是否安全和合规是隐私计算技术面临的难点。同 时,由于多方数据质量参差不齐,数据所有者缺乏可信的激励机制、贡献评估和 利益分配流程,使得是隐私计算技术同时面临多方难互信、多方难协作等问题。
区块链具有数据可溯源、难以篡改、公开透明、智能合约自动执行等技术 特点,是解决多方协作和多方信任问题的一把利器。通过共识机制在参与方之间 建立信任基础,实现点对点的价值传递。通过智能合约实现链上数据真实性验证 和审计。通过协同机制、激励机制的设置与共识,促进数据开放共享与价值协作。
隐私计算与区块链都综合利用了密码学、分布式系统等技术,既有相似之处 又各有特点。通过将隐私计算和区块链相结合,不仅融合了二者的优势,也能解 决双方技术面临的部分难点问题,实现“1+1>2”。既能在数据共享过程中有效 保护个人信息,实现数据的安全流通,还能为数据的真实性、数据确权等合规问 题提供可行解决方案,实现数据共享全流程可记录、可验证、可追溯、可审计, 并为进一步建设高效、高安全和高流动性的数据要素市场打下基础。
第三节 隐私计算及区块链产业发展现状
隐私计算及区块链技术为数据要素市场化进程提供新燃料
截止 2021 年底,我国数据要素市场规模将达到 704 亿元,预计在“十四五”期间将突破 1749 亿元,总体上 进入高速发展阶段。在“十三五”期间,数据采集、数据清洗、 数据标注、数据决策等数据要素核心环节驱动数据要素市场规模快速增长。
伴随着各行各业数据价值沉淀和数据价值挖掘逐渐饱和,企业个体对 另类数据的饥渴态势逐渐显现。然而,当前企业数据泄露事件屡见不鲜,黑客 掮客非法获取并量贩个人信息,地下黑灰产对数据明码标价进行买卖,已形成规 模化市场。数据交易存在大量需求却“无技可施”,大量的数据供应方与数据需 求方之间缺少安全、透明、可控的交易桥梁,而隐私计算和区块链技术的融合 使得数据合规交易“有技可循”。
近年来,数据交易市场再次升温,各大数据交易平台借助隐私计算、区块 链等手段,解决数据确权、数据资产化、数据定价等难点问题,推动多维度数据 有序流通融合,加快我国数据红利释放。截止 2021 年底,我国 数据交易市场规模将达到 68 亿元,预计在“十四五”期间,数据交易市场规 模将达到 497 亿元。随着顶层设计 和配套设施逐渐完善,基于隐私计算与区块链等技术,具备合法资质的数据 交易平台可有效保护企业个体的隐私与权益,将是企业个体获取另类数据 的合规途径。
隐私计算及区块链技术被初步运用并逐渐普及
随着大数据生态的繁荣以及数据共创合作深入和细化,各机构之间的数据共 享、样本碰撞、联合建模需求越来越多,各行业纷纷探索隐私计算及区块链技术 应用,积极开展相关应用落地,希望能够提供安全的数据共创环境,促进并深化 政企协同、行业协同、区域协同力度。企业内部通过数据流通技术打通各业务线 “数据孤岛”,产业链条通过数据流通技术打通上下游的“数据壁垒”,各垂直 领域通过数据流通技术打通行业间的“数据鸿沟”。
2025 年将有一半的大型企业机构,在不受信 任的环境和多方数据分析用例中使用隐私计算处理数据,大数据生态的普惠性协 作将达到前所未有的水平。截止 2021 年 6 月,我国数据总量达 9ZB, 全国联盟链总节点数已达 36000,通过区块链技术进行流通的数据已达 80PB。 隐私计算节点数已达 4500,通过隐私计算技术进行流通的数据已达 2PB。目前 数据安全流通量不足数据总量的十万分之一,未来有广阔的数据蓝海有待探索。
各行业应用落地百花齐放,区域化发展趋势凸显
北上广浙苏依托自身人才与技术优势,大力发展数据流通关键技术,围绕中 心经济地带的地域,结合自身特点发展相关业务应用。在应用 层面,隐私计算在互联网行业渗透率最快,金融、电信、医疗等行业渗透率提速 攀升。区块链在政务、供应链、金融等领域得到逐步普及,应用落地多向开花, 其他行业渗透率稳定攀升。在全球抗击新冠疫情的战役中,隐私计算及区块链技 术在联合诊断、医疗信息共享、冷链溯源、公益捐赠管理、个人身份管理、打击 假新闻等方面发挥重要作用,为政府部门提供切实的解决方案。
区块链厂商抢先布局隐私计算,助力数据价值流通
近两年,隐私计算产业迸发式增长,互联网巨头、数据服务商、初创企业、 金融机构、运营商纷纷加入隐私计算赛道。目前国内 56 项隐私计算产品,其中 21 项出自区块链背景企业。由于隐私计算与区块链技术形成了天然的互补以及两者产品形态同源异流,区块链企业凭借长期技术积淀和切身业务诉求驱动,率先探索隐私计算产品研发与应用。
行业共识逐渐凝聚,标准制定稳步推进
随着隐私计算和区块链技术的兴起,国内对于两项技术的标准化研究也在 快速发展中。隐私计算相关标准主要集 中在对各类技术的整体框架、调度管理、数据处理、功能描述、算法实现和安全 要求等方面进行统一的规划梳理。区块链相关标准旨在围绕区块链技术的概念、 技术和应用三个维度,提升不同平台的一致性和互操作性,基于建立行业共识的 基础上为构建整体的区块链生态提供规范的基础资源框架。
国外开源项目逐年增多,国内开源生态仍有待培育
随着区块链行业的不断发展,国外开源项目数量持续增多,不断推进开源生态进步,开源项目数量呈现逐年增加的趋势。其中可信执行环境是 联盟链开源项目的主要研究方向,零知识证明是公有链开源项目的主要研究方向。 我国开源项目起步时间明显晚于国外,但国内开源意愿 不强烈,项目活跃度与国外开源项目有较大差距。
第四节 隐私计算及区块链技术发展现状
各研究方向逐步明晰,鲁棒性、通用性和扩展性快速提升
在过去 20 年,多方安全计算和同态加密的性能提升了 3-7 个数量级。随着实际生产中对隐私计算的需求快速增加,学界、业界等各方积极研究通信效率更高、计算速度更快的安全协议。随着软硬件技术不断突破和算法不断优化,同态 加密、多方安全计算、零知识证明等关键技术的门槛会越来越低,支持的复杂运 算任务将会越来越多,灵活易用、多元化、通用的隐私计算产品将会是大势所趋。 2020 年、2021 年参与中国信通院可信区块 链测评一共 46 项区块链产品,其中具备隐私保护能力的产品占 71%,国密算法 支持率达 78%。区块链支持的隐私保护手段逐渐多样化,以传统加密、同态加密、 权限控制为主,可信执行环境、多方安全计算和零知识证明均有产品尝试。
专利数量迅速增长,通用隐私计算是区块链领域的研发重点
全球区块链结合隐私增强技术的相关专利申请起步于 2014 年,我国在该领域的专利申请起步于 2016 年,随后在 2018 年起呈现爆发式增长,申请人数量和申请量几乎成正比增长,呈现典型的新兴技术萌芽发展态势。在 区块链隐私保护的技术体系中,全球技术研究布局始于身份隐私、计算隐私和硬 件隔离,逐渐向多元化路线发展。2017-2019 年期间,研究重点是区块链参与者 身份和交易金额的隐私保护,随后研究方向逐渐从单一隐私保护算法向混合的、 通用的隐私计算技术发展。其中安全联合建模和数据授权计算是近期的研发重点, 具有较大发展潜力。
高效的全同态加密方案一直是隐私计算的重点课题
从同态加密(Homomorphic Encryption,HE)的概念提出开始,经历了早期的 半同态方案、类同态方案之后,高效的全同态加密方案一直是该领域的重点发展 方向。部分同态算法和类同态加密效率更优,但仅支持单一运算类型的、有限次 的密文运算,可应用的场景和产品较为局限。全同态加密算法理论上可支持无限 次任意运算和运算组合,但由于其基础理论复杂度较高,实际使用时存在效率低, 密文存储空间占用大的问题。
多方安全计算逐渐从简单计算向复杂应用转移,成熟通用框架初现
多方安全计算(Multi-Party Computation,MPC)最初的研究起点是针对集合求交、布尔运算、算术运算、匿踪查询等比较简单的安全计算场景,主要基于两 条发展路径:一条秘密共享,一条混淆电路。在基于秘密共享的发展路径上,预 计算阶段的性能随着新的密码学工具得到了较大的提升,算子算法也逐渐形成计算框架。混淆电路则更多聚焦于更强大的敌手能力模型下的安全计算场景。从学术论文的角度看,近年来,恶意安全模型下的 MPC 协议研究比例在增加,复杂 计算的研究比例在增多。此外,近年由于数据联合建模方面的需求逐渐增多,也促进了基于 MPC 的机器学习算法的研究,将多方安全计算技术拓宽到更广义范畴,使得 MPC 更具有可落地的应用性。在区块链系统中,MPC 主要被运用在密 钥管理、身份认证、共识机制等环节中,以提升区块链系统的安全性的隐私性。
零知识证明是近年来区块链领域的研究热点
零知识证明被应用在区块链系统中,主要体现在可验证计算、身份认证、分 布式存储、共识机制、计算压缩与扩容等方面。其中递归零知识证明(Recursive SNARKS)、凯特承诺(Kate Commitment)和可信设置移除是近期区块链结合零 知识证明的研究热点。通过递归零知识证明可以压缩区块链账本的大小,从而减 小存储开销和通讯开销,提高区块链网络的性能。通过移除可信设置可以将区块 链和隐私计算网络的信任根去中心化,从而提高网络的安全性和鲁棒性。
可信执行环境是当下通用隐私计算最高效的解决方案
在区块链系统中,可信执行环境主要用于机密交易、机密计算、共识机制和 跨链等方面。通过将虚拟机或执行引擎置于可信执行环境内便可构建通用的可信 计算框架。通用的可信计算框架依托于区块链带来的公开透明,通过将可信执行 环境的信任根、代码度量、计算行为在链上公开验证,可构建区块链和可信执行 环境的信任闭环。
第二章 核心挑战与融合价值
隐私计算和区块链均是密码学发展的产物。在区块链中,密码学的运用是为 了验证和协作,在隐私计算中则是为了安全和隐私。隐私计算虽然实现了在多方 协作计算过程中对于输入数据的隐私保护,但原始数据、计算过程和结果均面临 着可验证性问题。区块链凭借分布式、公开透明和不可篡改的特性,可有效构建 信任协作网络,完美契合数据确认、有序流通、透明监管的需求。区块链与隐私 计算的有机结合,使原始数据在无需出域与归集的情况下,可实现多节点间的可 信协同计算和数据隐私保护。同时,能够解决大数据模式下存在的数据过度采集、 数据隐私保护,以及数据储存单点泄露等问题。区块链确保计算过程和数据可信, 隐私计算实现数据可用而不可见,两者相互结合,相辅相成,实现更广泛的数据 协同。
第一节 数据流通面临的挑战
数据流通仍有诸多问题亟待解决
第一,由于数据要素可被轻易复制的特殊属性,数据的拥有方不放心让自己 的数据进入流通环节,企业担心数据在流通过程中可能造成商业机密的泄露,个 人担心数据在流通过程中可能会造成隐私泄露的侵害。第二,由于数据要素难以 确权定价,数据流通难以规范化和市场化,当前的数据流通存在黑市交易、无序 流动、数据孤岛等现象,数据价值无法充分释放。第三,由于各方数据质量参差 不齐,使得多方数据共享后的价值大打折扣,组织间难以协作联动,阻碍数据共 享。第四,由于数据流通技术的隐私和安全能力难以量化评估,数据流通服务多 以黑箱形式示人,难以自证安全,需求方难以分辨优胜劣汰,阻碍产业健康发展。 第五,数据流通服务的准确性、真实性与服务稳定性难以保障,给数据的使用者 带来安全和业务隐患。第六,随着数据融合应用的深度不断深化,标准化的数据 流通产品无法满足数据需求方的深度融合与利用诉求。针对个性化的模型和策略 共创需求,缺乏保护数据源数据与需求方商业秘密的两全方案。
仅靠单一技术难以构建高效、高流动性的可信数据共享网络
任何单独技术都有一定的使用范围,只有从单一技术走向融合技术,才能满足数据安全流通的多种需求。要让数据充分流动起来、更高效地互通共享产生更 大价值,有必要打造开放的、多元化的、多层次的数据共享网络,吸引不同需求、 不同偏好的数据持有者参与进来,并进行高效的可信协作,形成网络效应。不过, 打造数据共享网络还有一系列问题需要解决,比如数据可信溯源、数据安全审计、 数据权属界定等问题,这些问题仅靠单一技术难以解决,还需要多元化的解决方 案。
第二节 隐私计算技术面临的挑战
数据共享流程缺乏安全性校验,参与者身份及数据缺乏记录和验证
隐私计算主要是解决了计算环节的数据隐私保护问题,但站在数据共享流通 的全链条来看,参与者身份是否真实、是否有主观作恶风险、数据内容是否完整 可信等问题都会带来数据隐私和可用性的风险。以联邦学习为例,参与联邦学习 的客户端很多,他们可以利用模型参数和训练数据实施攻击。另外,由于中央服 务器负责聚合数据、客户端选择和全局模型维护,因此中央服务器可能会被攻击 者所利用。
数据共享参与者缺乏合理的激励机制和公平的协作环境
隐私计算是多方之间联合产生共同成果,然而各机构业务发展水平不同、数 据质量参差不齐、特征分布不尽相同、成果贡献缺乏合理的评估和利益分配机制。 拥有高质量数据样本的数据源对共同成果的贡献更大,如果没有合理的贡献度价 值衡量机制,就难以激励数据所有者与其他数据源进行合作,不利于数据共享。 在复杂的多边关系场景下,如果信任成本太高、合作摩擦系数太大,将导致多方 协作无法建立,难以达成规模效应。
第三节 区块链技术面临的挑战
链上账本数据公开可见,无法满足多元化的数据隐私保护要求
从本质上来说,区块链是一个分布式账本系统,需要不同节点对交易以及状 态进行验证来达成共识,这要求链上数据都是公开共享。虽然数据的透明度提高 了,却带来了数据的隐私问题。区块链中部分数据提供方可能并不希望自己的数 据全部公开,比如交易身份、金额、合约等比较敏感的数据,这不仅包括个人交 易隐私,还包括应用场景中各种业务数据。因此,为在更广阔的领域使用区块链 技术,需要解决链上数据的隐私保护问题。此外,虽然区块链可以解决链上数据 的正确性问题,如数据上链后不能篡改、可追溯等,但如何保证数据存入区块链 之前的真实性和可靠性仍存在挑战。
链上数据处理能力不足,制约了区块链进一步拓展应用场景
链上计算受限于虚拟机执行和网络共识性能,导致了链上无法承载大量交 易和无法即时交付等问题,然而很多时候区块链应用需要支持高吞吐的交易量 和即时交付的能力。具体来看,首先区块链智能合约的计算能力亟待扩展。随 着区块链业务场景的复杂度增加,仅通过区块链链上智能合约实现的逻辑极为 有限,急需在保证数据隐私安全的前提下扩展链上的计算能力。其次,缺乏链 上链下协同、可支持多种业务验证需求的可信执行环境。将链上计算任务外包 给链下执行,需要连接链上链下数据的可信通道;为保证链上数据的真实性, 需结合链下数据进行融合计算,需要链下执行计算的可信环境。
第四节 隐私计算与区块链融合带来的优势
基于区块链和隐私计算的身份及密钥管理能力可应用到平台、网络和节点的 安全加固方面,同时也为链上数据提供了增强版安全服务,实现数据合作参与方 的进一步增信,为高要求的行业应用提供更安全的技术支撑。从技术角度看,基 于区块链隐私计算实现的密钥分发功能,可降低密钥中心化存储的安全风险,体 现出密钥分片存储的价值。基于区块链隐私计算实现的密钥协商功能,通过区块 链公开传输密钥材料并进行身份核验,可防止中间人攻击和丢包攻击。基于区块 链隐私计算实现的多重签名及组装验签功能,各参与方使用自身私钥和群签名完 成签名并将签名分片发送给组织方,同时组织方根据收到的全部签名分片计算得 到最终的多重签名并可根据群公钥验证其有效性,从而增强数据协作的安全性和 效率,体现出分布式签名的价值。基于区块链隐私计算实现的分布式身份和可验 证声明功能,可使数据资产标准化并授权可控,结合数字签名和零知识证明等技 术,可以使得声明更加安全可信,为进一步的精细化权限管控提供基础工具。
解决数据共享参与者身份及数据可信问题
参与者身份不可靠或者存在主观作恶意图,就可能会在隐私计算过程中合 谋推导出其他参与者的隐私数据,或者在计算过程中提供假数据参与计算,造 成非预期的计算结果,极大影响数据共享挖掘出的数据价值。应用隐私计算和 区块链技术,一是提升隐私计算的活动监测和监管审计能力。可以通过技术手 段和共识机制对参与共享计算的关键数据进行链上共享和真实性交叉验证,同 时亦可以对参与方的数据操作进行溯源,使得数据共享过程具有可追溯性;二 是提升恶意参与者的作恶成本。通过分布式数字身份,可以实现对参与方的数 字身份管理,通过签名算法确保参与方的真实可信,避免参与方的仿冒。参与 者的行为记录如数据写入、计算结果传递等都可记录在链上,永久存储并不可 篡改;三是提升参与共享计算的数据质量。通过区块链记录数据共享过程中各 参与方的行为,引入数据质量评价体系,从而反向推动实现安全、可信的数据 共享计算。通过智能合约对客户端 上传的局部梯度进行异常识别并抛弃那些可疑的数据。另外,在多方安全计算 中,通过区块链来记录和共享关键中间参数,核验各方在计算流程中是否有作 恶行为,以此来保证计算流程的安全性。
增强区块链的隐私保护能力
区块链的隐私保护方案可以分为以下三大类:混淆方案(Obfuscation)、 隔离方案(Isolation)和密码学方案(Cryptographic)。其中链上交易机密 性、不可链接性和不可追踪性是密码学方案的主要目标。通过在区块链系统中 引入用于隐私保护的密码学算法,比如同态加密、环签名、零知识证明等隐私 增强技术,在链上直接解决数据隐私保护问题。比较常见的方案是在原有区块 链的账户模型上进行拓展,附加一层隐私交易方案,以此来保护账户和交易信 息的隐私。近些年,区块链的隐私保护能力已经从匿名账户和机密交易拓展到 通用的隐私计算,在数据结构、共识机制、虚拟机等层面引入隐私增强技术均 有相应的方案尝试。
目前,半同态加密是区块链链上数据隐私保护的主要手段。上链的数据可通 过调用 Paillier 半同态加密库对明文数据进行加密,链上的密文数据可通过调用 Paillier 预编译合约实现密文的同态加运算,密文返还回业务层后,可通过调用 Paillier 库完成解密,得到执行结果。
扩展数据安全流通纵深体系
链下计算作为区块链扩展方案之一被广泛采用。链下计算的基本思路是将原本置于链上处理的各类事务,外包给链下处理,而链上仅保留验 证的部分,以此间接提升区块链的数据处理和隐私保护能力。通过扩展链下计算 网络,区块链专注业务逻辑可信执行与数据权属凭证流通,而链下隐私计算网络 则负责大规模运算和数据价值流通。近些年,以零知识证明技术为主的公链链下 计算方案层出不穷,主要是通过将链下数据处理过程压缩成一个可验证的证据包 置于链上,以减少链上的计算规模和成本。不过应用过程中仍难以平衡好安全性、 隐私性和性能,会带来较为严重的性能损失,无法支持大规模的计算场景。目前 一种比较好的解决方案是结合可信执行环境来解决。可信执行环境起到了硬件中 的黑箱作用,在可信执行环境中执行的代码和数据操作系统层都无法偷窥,只有 代码中预先定义的接口才能对其进行操作。于是结合可信执行环境可以把区块链 隐私问题转化为权限控制问题。在应用中,用户可以通过软件层权限定义来设计 各种模型的隐私保护需求;在效率方面,由于可信执行环境的黑箱性质,在可信 执行环境中进行运算的是明文数据,而不是同态加密中的复杂密码学运算,计算 过程中效率没有过多损耗,因此,与可信执行环境结合可以在性能损失较小的前 提下在很大程度上提升区块链的数据处理和隐私保护能力。
构建全程闭环的数据生命周期安全管理
数据生命周期全流程管理包括数据采集、传输、存储、使用、流通、销毁等 环节。隐私计算结合区块链技术可以应用到数据流通全流程各环节当中,包括数 据生成及采集合法性验证、数据处理存证和共识、数据使用授权、数据可信流转、 数据安全加工和协作、以及数据管理审计等,实现全程闭环的数据安全和隐私服 务,操作和处理记录可上链保存、不可被篡改。
数据共享计算参与者可以在链上用智能合约来实现计算过程中的协作管理 功能,由参与方之间共同治理隐私计算过程,协作过程公平公正、公开透明、权 责对等,避免了中心化协调方参与带来的隐私泄漏的风险;另一方面,数据持有 者可将共享数据目录、数据使用申请、数据使用审批、数据使用审计等功能上链, 链上参与方可以对其他参与方的数据资源一目了然,计算过程的数据使用情况可 以存证留痕,确保参与方按照约定的方式进行计算,提升数据共享协作效率。可 通过多方签名确认的方式记录数据的关键状态,进一步提高数据可信度,同时可 通过对哈希值的验证匹配,实现信息篡改的快速识别。基于链上数据的记录与认 证,可通过智能合约,实现按照唯一标识对链上相关数据进行关联,提升数据的 可追溯性。
培育共享共生的数据要素市场生态
数据要素市场化的前提条件是成熟的数据确权机制和稳定的数据流动性。 权属界定不清、要素流转无序、定价机制缺失、安全保护不足等问题一直是掣 肘数据要素高效配置的“痛点”。只有保障数据资源的价值、解决数据权属关 系边界模糊的问题,让数据主权真正的回归到每一家机构和每一个个人,才能 使数据具备权利属性,进而设定为资产。首先,结合区块链技术,可使用数据 标签、数据指纹、分布式身份等方式先为数据资产生成唯一标识符,然后在链 上与数据持有者的数字身份进行关联,实现数据持有者对数据资产权益的公开 确权。其次,基于区块链构建的可信协作关系,各参与方可进一步共创数据价 值流转和分配机制,让数据资产交易的公平透明度提升,激励参与方积极贡献 数据、模型或算力。再次,隐私计算可以把数据使用价值精确限制到具体算法 和使用次数,实现用途可控可计量。数据所有者通过签名算法声明数据的所有 权,通过加密算法规定数据的使用权。数据交易市场可以从数据持有者处收集 数据,然后为数据消费者提供隐私计算服务。数据消费者提供一个特定的计算 任务,其输入是其指定数据在特定算法下的一次使用权,而输出是数据消费者 想要的结果。这样,数据的所有权和使用权进行了分离,并且可以使数据资产 价值以市场化的方式计量,从而进一步促成数据交易市场的定价机制。
第三章 典型解决方案
区块链技术的应用场景可以分为三个阶段:链上存证、多方协作和价值转移, 其中隐私计算是区块链发展到第三阶段必不可少的技术工具。目前,隐私计算和 区块链技术仍在不断地发展迭代和快速应用中。本部分将结合着具体的场景,简要介绍当前隐私 计算结合区块链的一些典型应用解决方案。
第一节 用于机构间联合风控
风控是金融领域的核心业务。金融机构出于数据安全及商业保密性的考虑,各家数据往往互相割裂,自建高墙,缺乏 信任,不愿进行数据共享,导致用户风控指标精准度低。一方面,优质的中小企 业缺少多维度一手数据的佐证,难以自证背景真实性及还款能力;另一方面,金 融机构也难以依据零散、缺失的数据对企业进行精准信用评估,最终导致银行风 控难、放款成本高,中小企业面临融资难、融资贵的困境。
隐私计算结合区块链技术在金融风控场景具有巨大的潜力,各机构对数据进 行加密上链,利用区块链所提供的数据与业务不可篡改、合约自动化执行的特点, 确保数据可追溯可验证以便于监管审计,提高违约成本和机构公信力,保障数据 的合法合规使用;各方的多维数据可在隐私计算的保障下,安全合规的多次开放 共享进行联合模型训练,提高风控模型的精准度。
以金融机构间联合风控场景中贷款机构或个人信用联合查询业务为例,业务流程如下:
贷前审核。中小企业申请贷款后,银行在不暴露客户隐私、不暴露查询 ID 的 前提下利用智能合约向联盟发起多方匿踪查询申请,联盟利用智能合约首先 验证银行身份、抵押令牌等信息;
贷中监控。身份验证通过后,一方请求多方响应,联盟内启动联合计算。由 联盟内各参与方联合查询和安全计算该贷款申请方的贷款记录、黑名单历史 等信息,并进行多方比对核验,最后将加密结果告知查询发起方银行。每次 查询发起信息和查询结果在联盟各参与方间存证。银行参考查询结果对贷款 申请进办理,期间所有数据流转和结果计算日志都进行上链存证,便于后续 追溯该笔贷款交易;
贷后跟踪。联盟上各参与方共同维护风险名单,智能合约对风险进行实时告警。每次交易后在各节点进行账户通证结算,对查询数据提供方和查询发起方实行激励机制和支付机制,鼓励联盟内各节点积极参与到查询结果的计算 和校验。
第二节 用于机构间联合营销
传统联合营销主要有两种模式,一种模式是不涉及到数据融合,按照约定的规则,给相应用户发放权益;另一种模式是涉及到数据融合,各方都把自己的数据准备好,放在同一个安全的服务器上,然后在安全服务器上进行数据融合建模,把融合的结果进行营销投放。从合作模式来看,因为合作方担心数据泄露,要么不做数据融合,直接广泛投放,要么非敏感数据集中式融合,所以 传统的联合营销还未实现精准化营销。
基于隐私计算及区块链技术,可以帮助联合营销各方在数据安全的情况 下,进行深度的数据融合。联合营销各方都是对等,通过在各个安全节点,让各方数据进行安全融合,原始数据都不出库,实现数据可用不可见,计算在数据源端,这样就可以基于多方用户特征数据建立用户分层模型,进行分层营销,每类用户权益不一样,在控制成本的同时,提升转化率、降低打扰率、实现精准化营销。
基于隐私计算及区块链技术可以保证企业在挖掘用户数据、构建用户画像 时安全合规。第一,所有用户个人数据相关的服务调用都必须获得用户的明确授权,借助区块链技术,授权及授权撤销均可以达到交易级的细粒度。所有数据查询和授权记录具备可追溯,无法篡改的特性。第二,所有涉及个人的明细数据和 加工特征不会输出,仅将模型或策略的结果输出和共享,保证数据最小化利用。 第三,在数据共创环节,所有个人用户的 ID 均会通过 HASH 散列方式处理,样本数据在交换之前经过匿名性检查,所有计算均在加密或脱敏之后的数据之上进行,最大程度的保障个人隐私数据安全。第四,采用区块链及隐私计算多层级的 分布式架构还提供了额外的安全性,数据不会集中于任何中心节点,具备更强容 灾与防攻击能力,杜绝了任意节点被攻破全盘皆输的风险。
联合计算公开可控。在客户授权后,营销机构在链上发起联合查询任务,提升跨机构协作的公开透明度。多方安全计算平台赋能机构对潜在客户多维度信息进行分析,从而更精准的投放广告。广告投放机构可以从更多数据维度 对客户购买意向建模,触达客户的整体画像;
数据可用不可见。数据合作各方通过本地安装的隐私计算节点完成联合查询 或联合建模任务,可保证原始数据不出域,仅输出计算结果;
问责和激励机制。数据共享计算后,联合营销参与方将每次查询的请求以及原始数据的 SHA 指纹存证到区块链,保证查询记录及数据真实可追溯。当用户对数据的正确性有疑问时,参与方可以从区块链上进行数据正确性验证, 保证查询过程中各方提供的数据真实可信;同时也提供了参与各方的贡献证 明,帮助在机构之间进行利益分配。
第三节 用于机构间联合数据运营
多方安全计算技术与区块链技术的深度融合,可以在跨机构联合运营场景 内实现客户消费行为数据的联合统计,在保护平台商户数据隐私的前提下,提供 了联合运营的解决方案,基于多个运营商数据联合开展客户运营,可达成多场景交易数据的联合计算,让数据联合运营产生价值。同时商户可根据业务规则自行 定制数据脚本,可以在不增加数据运营人力的基础上,为平台客户指数级增长提 供技术支持,有效解决数据服务成本高的问题。
在运营商户联合计算场景中,商户本地部署区块链节点和 BaaS 工作台,用 户在工作台上可实现联合计算商户对象的选择、场景数据的申请和授权,计算算法的发布及计算任务的配置,场景数据计算过程中的计算算法、计算数据及授权等数据操作在各方达成共识后存证区块链,实现数据的隐私计算及计算过程的审 计追溯。
本地部署区块链节点和 BaaS 工作台:运营商户通过工作台,用户可实现联 合计算商户对象的选择、场景数据的申请和授权等操作;
发布联合安全统计计算的算法:联合运营商户将业务逻辑转化成智能合约,在平台进行发布;
配置安全联合统计计算任务:联合运营商户根据自己的实际业务场景需求, 创建多方安全计算任务并进行配置;
运营商户发起查询:运营商户在界面发起查询请求,启动多方安全计算任务, 反馈基于多方的安全统计计算结果;
计算的可追溯:计算过程中的计算算法、计算数据及授权等数据操作存证于 区块链,在审计监管角色下实现数据计算过程的审计追溯。
新运营模式主要体现如下亮点
商户资源价值提升,支持新的商业模式。在保护平台商户数据隐私的前提下, 提供了联合运营解决方案,让多机构联合开展客户运营,各商户的流量、数据等 资源均可通过联合运营实现商业变现,支持新的商业模式。
提升客户体验,实现拓客和活客。在开放生态中,客户在任何服务场景中的消费行为均可被生态内其他场景所认同,并且跨场景的用户行为认同延时从 T+2 日缩短至准实时,可真正实现以“客户为中心”的消费金融服务。
降低运营成本,支持多机构生态共建。数据中台通常采用“中心化运营”, 即相关数据查询服务须由服务提供商统一定制开发,这种方式在支持开放生态的 数据运营时力不从心,其在数据运营的技术支撑投入无法随着生态数据维度、参 与方数量的增长不断增加,需要一种新的模式有效支撑不断增多的数据运营需求。 在区块链中,所有的数据查询脚本均由运营商自行定制并共识发布,可以在不增 加运营人力的基础上,解决数据服务成本不断升高的问题。
区块链全程追溯,填补多方安全计算空白。在计算过程中,多方安全计算服 务与区块链交互,区块链实现计算生命周期下的数据、操作、计算过程及结果的 全程可追溯、防作弊,满足安全计算及审计监管等要求。
第四节 用于可信协作与跨链取证
存证是目前大量落地推广的区块链场景。区块链通过存证业务汇聚并沉淀 多方数据的同时,也形成新的数据孤岛。跨链技术(Cross-Chain)可使各个链之 间进行不同程度的互操作。通过应用层跨链,很难保证信息的真实性,同时应用 层适配异构链的改造成本也很高,如何能够低成本地进行信息可信跨链传递,成 为迫切需要解决的问题。
在司法诉讼场景中,多因存在举证难、固证难、立案难、诉讼难、执行难、 成本高、时效长等问题,亟需通过公证前置将所有者权益固定并公证赋强。以隐私计算建立区块链互联互通网络并赋强公证系统,能够实现司法公证与其他领域的链上数据共享,自动化生成公证申请表、公证受理单与公证询问笔录,最终自动生成电子“公证书”,实现高效、安全、批量办理。在不良资产处置、电子合同、内容版权等司法场景中,如果发生任何纠纷,司法区块链可以通过跨链服 务,可信获取其他链上的证据信息,保证证据真实性,提升证据收集的效率及有 效性,降低司法判案成本。
通过隐私计算技术实现的区块链跨链系统,可以在数据隐私保护的情况下, 实现跨链数据按需出入与传输可控。在跨链交互方面,可信执行环境、多方安全 计算、零知识证明等技术由于其可代理、可验证、可协作等特点,被用于构建可 信中间人和价值传递中介。在链与链互操作的过程中,跨链系统在验证跨链取证 请求的存在性和真实性后,利用可信执行环境、多重签名、门限签名等方式向目 标链发起跨链事务处理请求,目标链验证请求并返回证据包。在这里,隐私计算 技术对原数据进行了安全认证、格式转化、重新声明等动作,起到“证明转化” 作用。通过建立信任根,从信任根开始到数据源、到可信中间人、到目标链、再到链上应用,一级度量认证一级,一级信任一级,构建信任链条并把这种信任扩 展到整个数据流通的生态中,确保数据跨链流通的完整性和行为的预期性。
在版权侵权审判的场景中,创作者在版权链上登记作品。版权服务平台日常 监测侵权行为,通过网页取证、录屏取证等方式提炼证据包并在版权链上完成固证。当法院受理案件时,版权服务平台向法院提交存证地址和存证内容,法院调用存证服务的接口进行证据核验。通过跨链访问获取存证内容,保证了获取信息的真实可靠。通过把公证处、司法鉴定中心、法院、CA/RA 机构拉入司法链, 对数据进行相应的鉴定,保证了一旦数据资产发生纠纷,能够被公正有效的处理。
第五节 用于链上数据联合分析与交叉核验
在一些场景中,业务数据会加密上链进行多方流转使用,需经过多方数据共 享计算并交叉核验其有效性后,才具有可信价值。典型的应用场景包括:
在金融行业,交易数据上链便于监管机构对链上数据进行审查分析和行为监 管,但有些大额高风险交易数据为了不被监管机构察觉,金融机构很有可能在上 链前就作了修改,为避免金融交易数据造假导致行业风险扩散,监管机构可通过 多方计算技术从金融机构提供的交易信息对手方或上下游行业获取相关的数据, 再与金融机构所提供的链上交易数据进行分析比对,即可及时发现金融机构是 否有交易数据造假行为,有利于对敏感数据流通及融合计算等场景进行有效监管, 从而有效增强金融监管的穿透性和专业性。
在供应链金融业务场景中,物流信息经过交通部门、银行等多方共同核验后, 才具备高可信的价值,才可被下游的业务机构取信用于提供服务,如中小企业通过物流信息来证明其业务真实性并向金融机构申请融资贷款。
在这些场景中,需要解决的问题:一是区块链上的流转数据由于隐私保护需 求可能会加密后上链,多方计算分析时需保证数据的隐私安全;二是参与融合计 算的链下数据在计算过程中也需要保护数据隐私安全,并需要有可信通道能够与 链上数据连接起来实现协同计算。
结合了链下计算的区块链系统可以实现在确保链上链下数据隐私安全的前 提下,融合进行共享计算,并对链上数据真实性进行交叉核验。以物流订单真实性多方核验为例。
数据上链。产业链上下游各企业在创建订单并完成运输和结算后,会将货源、 运单、轨迹、支付订单等信息加密后上链;
数据交叉核验。结合可信计算环境,可以连接区块链链上数据(加密物流订 单信息)和链下可信数据源,包括授权访问的加密交通轨迹数据和加密交易 订单支付信息等,在各方数据隐私得到有效保护的前提下,基于可信应用对各方加密数据进行真实性交叉核验和联合统计分析,核验结果和联合分析报表上链存证,实现数据使用的可追溯和可审计;
查询结果。基于链上核验后的可信订单信息和联合统计后的业务报表,中小 企业可以证明其业务真实性并寻求融资贷款。下游的金融机构在审核贷款申请时,可以获取链上物流数据作为审批依据。
第六节 用于第三方外包数据处理可控授权
数据管家制度(Data Stewardship)是一种新的数据治理模式,可促进数据持有者和使用者之间的信任,提高数据治理的透明度并使用户更好地控制个人数据。数据管家充当可信赖的中立中介,与数据的利益相关者进行接触和谈判,在 保护个人隐私的情况下进行数据共享,以实现更大的社会利益。
在一些应用场景中,数据持有者需要将数据对外提供给合作方进行数据处 理,比如在数据外包处理场景中,数据持有者委托第三方对其数据进行开发处 理。传统类似场景中,数据一旦从数据持有者转移到第三方之后,这份数据的实 际控制权就转移到第三方了。第三方可能将数据私自留存、或使用在非授权场 景、甚至转卖,数据持有者对这份数据的使用情况既缺乏感知能力又没有控制能 力,也无法验证第三方是否按预期真实完成了数据的计算服务。
隐私计算结合区块链技术可以帮助实现“数据转移,控制权不转移”的能力, 达到数据流转中的可控、可用、可验证目标。主要实现思路是:一是提供数据使 用全过程加密的能力防止数据滥用或泄露的发生,另一方面也通过全过程使用 记录加密上链的方式保证外包使用行为的可验证和不可否认,解决客户的担忧。
数据使用申请。首先在数据流转管控链上,数据使用者向数据持有者申请使用数据,通过智能合约自动审批并通过后可获得数据的授权使用凭据;
数据使用授权。数据持有者将加密后的共享数据提供给数据使用者,数据使用者只有使用授权凭据才能通过数据使用组件对共享的加密数据进行相应的计算、查询操作,且操作结果也会按照数据持有者的策略配置进行脱敏后 输出;
数据使用审计。数据的所有使用记录过程也会被数据使用组件自动上传到链 上进行存证,用于后续审计;
数据使用凭证销毁。一旦发现数据使用者有不合规行为,数据持有方就可以通过销毁授权凭据来撤销对数据使用者的授权,即使数据使用者留存了加密后的共享数据,也会因为无法解密而失去使用价值。
第七节 用于价值可计量的数据资产流转
在数据的开发和利用过程中,数据的使用方式越广泛、维度越丰富、价值就越大,要进一步盘活数据价值就需要通过安全合规的数据交易平台让数据流动起 来。为了激励数据持有者积极参与数据流通,需设计可计量的数据价值交易机制, 对数据计算过程中各方的贡献进行可信追溯与衡量,实现数据价值可计量流转。 数据交易市场(Data Marketplace)可通过区块链技术连通多个参与方,实现机器学习过程中的数据采集、数据 授权、模型训练、模型使用的全链路数据追踪与行为记录,链上结合智能合约和 激励机制实现数据审计、参与方贡献与激励等功能。通过隐私计算技术,实现“可 用不可见”的数据加工、数据建模、数据评估等功能,保证数据提供者在不失数 据控制权的情况下,出售数据的使用权。
质押数据资产。数据提供方对数据进行预处理并加密,之后将加密数据上传到集中式或分布式的存储服务中,供后续隐私机器学习使用;
数据资产登记。数据提供方通过分布式身份服务获得数据身份凭证,之后将数据身份凭证以及数据使用条款包括数据地址,算法限制、模型限制、使用次数、隐私预算(Privacy Budget)等约束信息上链审核,并通过智能合约管理数据资源目录,方便后续进行贡献判定、数据定价、任务匹配等过程;
算法或模型登记。数据计算方通过分布式身份服务获得模型身份凭证,之后 将模型身份凭证和模型使用条款上链审核;
任务匹配和数据授权。数据消费方将隐私计算订单上链。数据交易市场根据隐私计算任务在数据池中匹配出获胜数据,并授予数据消费者该数据在特定 规则下的使用权,并调度隐私计算平台执行训练任务;
定价机制。数据所有者根据其数据使用情况获得隐私补偿(Privacy Compensation)。智能合约依据数据的使用效用、使用次数、计算消耗、隐私损耗(Privacy Loss)等指标更新数据价格。
虽然隐私计算和区块链技术融合可以实现数据可控可计量的隐私保护计算, 但目前数据交易市场仍面临贡献分配、无套利定价、个性化服务、隐私披露风险 评估、数据质量评估等诸多问题。首先,量化的数据质量和披露风险是决定数据 价格的重要因素,训练数据集的数据质量和隐私泄露风险等级,需要特定领域的 专家进行评估,并进一步平衡数据价值、隐私泄露风险和经济回报之间的关系。 其次,数据定价应具备无套利性。无套利性定价是指一组同样质量的训练数据集, 其价格的一致性。数据消费者不应在市场中推导出一组更便宜的训练集以获得相 同的训练结果。再次,数据交易市场应具备个性化服务。个性化服务是指数据所有者有完全不同的隐私偏好,数据消费者有完全不同的价格偏好,这就需要个性化的隐私损失区间和不同价格的训练数据集以适应所有数据消费者。
第四章 展望与建议
建立一个数据安全流通的数字社会是一个遥远愿景,要实现这一目标,就需要大幅改变数据治理、共享和使用方式。隐私计算主要解决数据共享计算中的数据隐私保护问题,区块链则侧重确保数据全生命周期管控,两者的结合为数据要素市场化提供了一套完整、严密的解决方案。随着核心技术的逐渐成熟落地,与数据资产相关赛道正在进入黄金发展期,更多资本市场资金有望进入并驱动行业 发展,基于数据资产的金融工具将激发数字经济的创新活力,并充分发挥其对实体经济的支持作用。随着各国政策不断支持与引导,信任和共享文化将得到大力 弘扬,区块链结合隐私计算技术也将成为各行业数据流通的标配,立竿见影解决 多方协作过程中的信任和隐私问题。传统的强制实施集中式大一统的数据聚合和管理中心逐渐向分布式、多层次、市场化的方向发展。过去一些涉及数据安全和 相对保守的市场,也能够更好地发展和发挥其内在数据价值,新的岗位需求也会 增加。
第一节 数据安全流通将成为国家重点战略
合理制定隐私保护法规,平衡隐私保护和数字经济创新空间
在数字经济的时代背景下,数据安全问题产生的社会影响越来越大,每一次 的数据泄露问题都能引起极大的社会舆论反响。数据安全关乎着用户的隐私、社会民生的发展态势、国家政策战略部署等等,涉及到方方面面。斯诺登的棱镜门事件引爆了全球舆论。各国都对数据的传输、 使用等安全方面做了严格的政策限制和法律保护。美国是数字经济的领先者,为 继续保持领先,其隐私保护法律(CCPA)相对宽松,为数字技术创新留下发展 空间;而欧盟无本土互联网巨头,通过制定严格的通用数据保护条例(GDPR) 来保护欧盟用户隐私,其本质是为限制中美等国互联网公司创新发展。我国目前 在全球数字经济发展中虽一定程度处于世界领先地位,但如果制定过严的隐私保 护要求,将会极大降低市场主体间数据共享合作价值和协作意愿,限制数字经济 的发展,并最终影响我国数字经济竞争力。建议监管机构应加强与产业界、学术界的合作,共同探讨制定合理的隐私保护法规,为我国数字经济创新留下发展空 间。
加大跨境数据流通的风险防控是促进国内国际双循环的必然要求
在推动跨境数据流动的有序开放,逐步构建跨境数据流动规则,不断扩大国 际合作范围的同时,应高度关注数据跨境流动中可能的风险。随着数据要素的资产化,知识和数据不仅成为数字经济时代的重要生产力,更关乎到国家安全以及国家政务、经济、金融、民生等安全与发展。数据安全已然成为国家管控的重中之重。对于跨境企业来说,随着国际上对数据安全方面的法律法规完善,必须要对现有不符合数据安全政策的运营数据基础架构做出调整甚至重新设计,以应对各国政策的监管。区块链及隐私计算技术为企业开展数据跨境联合运营提供安全可靠的技术手段,为支撑数字经济和数字贸易全球化发展,实现以数据为生产要素的数据跨境流动提供新思路新方案。
推进数据流通与共享应坚持技术优先和市场化两大原则
对于数据价值的社会化发挥,有两种不同的方式:一种是通过数据本身的流通来实现数据价值的社会化共享,另一种是数据不流通但数据的价值在社会多方主体之间流通。由于数据的特性,数据本身流通是比较有限的,这既有个人隐私保护所带来的客观限制,也因为数据共享后难以控制导致企业主观上不愿意对外共享。因此,应当将关注的焦点更多地从“数据的流通”转移到“数据价值的流 通”上来,并在此过程中要坚持两个原则。一是技术优先原则。结合区块链、隐私计算等创新技术,在数据本身不用交换的情况下实现数据价值的共享。传统的强制实施集中式大一统的数据整合和管理并不可取;二是市场化原则。绝大部分数据是企业投入大量资源从非结构信息中提炼、加工出来、需要保护的商业机构资产权利。如果不尊重和保护企业的财产权益,强制商业机构无条件共享数据, 会降低机构进行数据生产和积累的积极性,长远不利于我国数字经济的可持续发 展。
以示范促应用,以应用促发展,推动部分行业的先行先试
支持有条件的地方政府、市场主体先行先试,探索构建适合各行业发展的分 布式数据价值交换体系。支持隐私计算及区块链技术在政务服务、金融、医疗等 数据密集型行业的示范应用,搭建行业可信计算底层平台,降低隐私计算及区块 链技术的使用门槛。同时在试点过程中,探索数据质量管理、数据权属界定、数 据定价方案等数据交易难题的可行解决方案,为未来进一步构建高质量数据要素 交易市场积累经验。
第二节 数据流通应用普及仍需时日孕育
国产化密码算法和安全硬件是数据安全流通的刚需
实现密码产品自主可控软硬件全国产化替换,是保障数据安全流通的关键 举措。数据流通产品从底至上涉及到大量的密码学和安全硬件技术,目前国内数据流通产品多以国外制定的密码学算法为主,尤其是美国国家标准与技术 研究院(National Institute of Standards and Technology,NIST)在密码算法标准制定上发挥着举足轻重的作用。由于密码学人才缺失、密码产品黑箱化等问题,大多密码产品并没有严格进行深度的国产化改造,容易引起木桶效应。随着国家对 数据安全方面的政策及法律法规完善,基于将来可能会涉及到的技术封锁的情况, 国产化算法的研究和使用将受到政策更多的倾斜,国产化的密码算法和安全硬件 的渗透率有望提速。
数据流通平台间的互联互通壁垒有望被打破
由于不同的数据流通技术平台基于自有知识产权的算法原理和系统设计实现,平台之间原生无法完成信息的交互,将“数据孤岛”变成了新的“数 据群岛”。数据的应用机构往往面对与不同的数据提供机构合作时,需要部署不同平台,存在着严重的系统建设和运营成本浪费,因此“互联互通”成 为了隐私计算在数据流通应用上一直面临的挑战。为了解决隐私计算跨平 台互通性的问题,隐私计算联盟正在积极开展互联互通系列标准的制定工 作,联合攻关具体互通协议流程的架构设计和解决方案,为推动数据价值的 安全流通,数据要素市场的基础建设添砖加瓦。
加强关键技术研发和标准制定,打造自主可控的技术体系
一是加强以区块链、多方安全计算、同态加密、零知识证明、可信执行环境、 可搜索加密(Searchable Encryption)等为代表的关键技术研发,鼓励密码学算法 和可信硬件的国产化,形成自主可控的技术体系;二是加快区块链和隐私计算相 关国内标准制定和宣贯实施,尤其是完善安全标准和安全分级,鼓励和支持基于 标准的测评认证,厘清技术安全水位和使用场景,提升机构数据安全和隐私保护 能力;同时积极参与国际标准制定,提升我国在区块链和隐私计算领域的国际话 语权。
加快培育隐私计算及区块链相关人才
目前市场上关于区块链和隐私计算的整体认知仍然较浅,尤其是隐私计算相 关人才匮乏,技术应用的落地门槛高、难度大。建议充分发挥企业、行业协会、 教育和科研机构在人才培训中的协调作用,有效连接“政企校”三方,推进校企 合作,明确人才培养标准和课程、拓宽培养渠道,完善和创新人才培养机制,为 推动我国数字经济发展提供人才支撑。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库官网】。
- 免责声明
- 世链财经作为开放的信息发布平台,所有资讯仅代表作者个人观点,与世链财经无关。如文章、图片、音频或视频出现侵权、违规及其他不当言论,请提供相关材料,发送到:2785592653@qq.com。
- 风险提示:本站所提供的资讯不代表任何投资暗示。投资有风险,入市须谨慎。
- 世链粉丝群:提供最新热点新闻,空投糖果、红包等福利,微信:juu3644。