导读
数字经济时代,数据对提高生产效率的乘数作用不断凸显,成为最具时代特征的生产要素。对于金融行业来说,要想充分释放数据要素潜能,开展同业或者跨行业合作是必然趋势;同时,推动数据有序共享、保护数据安全也是根本要求。那么,如何在保护数据隐私安全的前提下,破除数据孤岛、打破数据壁垒、完成安全多维度的数据融合?促进数据去中心化流通的区块链技术,和实现数据可用不可见、可算不可识的隐私计算技术,正在成为强有力的助推器。
1、数据流通面临的挑战
《金融科技发展规划(2022-2025年)》指出,要有力有序推进跨机构、跨地域、跨行业数据规范共享。因此,首先要明确,目前数据流通与合作的实践中,面临着怎样的挑战。
数据要素可被轻易复制
明文数据一旦可见就可被无限复制,这导致数据拥有方不放心让数据进入流通环节,担心暴露数据信息和隐私、泄露商业机密。
数据要素难以确权定价
一方面,数据复制导致的数据乱用、滥用,让数据价值无法定价,无法形成大规模的市场流通。另一方面,数据流通难以规范化和市场化,存在黑市交易、无序流动、数据孤岛等现象,数据价值无法充分释放。
数据质量参差不齐
这导致多方数据共享的价值大打折扣,组织间难以协作联动,阻碍数据共享。
技术服务能力难以量化评估
数据流通技术的隐私和安全服务多以黑箱形式示人,无法自证安全,需求方难以评估服务的准确性、真实性与稳定性。这也阻碍了产业优胜劣汰、健康发展。
个性化服务有待发展
标准化的数据流通产品无法满足数据需求方的深度融合与利用诉求。针对个性化的模型和策略共创需求,尚缺乏保护数据源数据与需求方商业秘密的两全方案。
数据共享网络有待打造
只有从单一技术走向融合技术,才能构建开放的、多元化的、多层次的可信数据共享网络, 吸引不同需求、不同偏好的数据持有者参与进来,并进行高效的可信协作,形成网络效应,让数据充分流动起来、产生更大价值。但是,打造数据共享网络还有一系列问题需要解决,比如数据可信溯源、数据安全审计、数据权属界定等问题。
2、区块链助推数据去中心化流通
随着数字技术的发展,数据流通面临的问题,可以从区块链技术中找到答案。
作为国家战略,区块链正在不同场景逐步落地应用,成为我国发展数字经济不可缺少的信任基础设施。我们必须明确,区块链应用对于某个场景的好处是什么? 区块链该不该用、怎么用?如果选择及执行得当,区块链可以带来新的效率和市场机会。但如果选择不当,这种复杂的多方系统反而会是一种负担。
区块链技术解决了什么问题
区块链是支持多个主体在非可信环境下高效进行复杂协作的系统。区块链技术天生具有数据可溯源、不可篡改、公开透明等优点,能够从根本上保证数据的唯一性、不可复制、不可篡改,可以应对数据克隆、确权等挑战。
可以说,区块链技术天然就是解决多方协作和多方信任问题的一把利器,通过去中心化、点对点的信息传递,建立共识机制,在参与方之间建立互信;通过智能合约,保证链上数据真实、可验证;通过协同机制、激励机制,促进数据开放共享与价值协作。
判断区块链适用场景的四个标准
要判断区块链是否适合在某一场景中应用,需要满足四个标准:一,主体数量多;二,各主体在非可信环境下交换价值;三,可解决信任摩擦,无需完成复杂协作;四,低成本、高效率。
因此,面对数据去中心化流通中涉及到的产业链场景,首先要评估是否满足四个标准。理论上,场景中主体数量越多、协作越复杂、信任摩擦越大,就越需要区块链来帮助。如果没有区块链的帮助,或许这些主体依然能完成这些协作,但成本非常高,效率非常低。
从区块链到联盟链
产业数字金融模式涉及到金融机构、产业链企业、第三方科技公司等多个主体,在产业区块链落地应用中,通常使用的是安全可控、稳定易用、高性能的金融级联盟区块链底层平台。联盟链兼顾金融创新与金融稳定,通过将样本、模型参数等数据上链,可为各参与方提供更加可信的计算环境,提升计算过程的透明性和可追溯性,实现各方互信。
联盟链更适用于产业数字金融

区块链虽然通过公开透明、数据可溯源实现信任,但是,在实际应用中,金融机构及企业都不可能把隐私数据拿到链上。要想实现数据的可用不可见、可算不可识,这个棘手的问题还得通过隐私计算技术来解决。
3、隐私计算实现数据可用不可见
如果说区块链技术建立了数据时代的信任机制,那么隐私计算则在数据共享洪流中为数据所有者建立了安全的隐私保护防线。
隐私计算即面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时,考虑隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。简单来说,隐私计算是从数据的产生、收集、保存、分析、利用、销毁等环节中对隐私进行保护的技术方法。
同区块链技术一样,隐私计算并不特指某一门技术,而是一种融合了密码学、数据科学、经济学、人工智能、计算机硬件、软件工程等多学科的综合技术应用。隐私计算包括一系列信息技术,如业界较早提出的安全多方计算(MPC)技术、以硬件技术隔离保护为主要特点的可信执行环境(TEE)技术、基于密码学和分布式计算实现多方协作机器学习的联邦学习(FL)技术,以及如同态加密、零知识证明、差分隐私等辅助性技术,都属于隐私计算范畴。
隐私计算部分技术一览

隐私计算技术的目的在于让数据在流通过程中实现可用不可见,即只输出数据结果而不输出数据本身。这一方面保证了数据所有者的数据所有权不受侵犯,满足数据流通的合规性;另一方面,各方主体拥有的信息数据能够高效流通使用,不断放大数据价值。
当然,一项技术的诞生及应用必然伴随着众多问题,数据真实性、数据来源、数据流通过程是否安全和合规等都是隐私计算技术面临的难点。同时,由于参与隐私计算的各方数据质量参差不齐,数据所有者缺乏可信的激励机制、贡献评估和利益分配标准,使得隐私计算技术同时面临多方难互信、多方难协作等问题。因此,人们开始研究如何融合区块链与隐私计算技术,试图探索出能够推动数据经济安全、可信发展的技术方案。
4、隐私计算+区块链:1+1>2
隐私计算和区块链均是密码学发展的产物。在区块链中,密码学的运用是为了验证和协作,而隐私计算中则是为了安全和隐私。具体到数据流通中,区块链确保计算过程和数据可信,隐私计算实现数据可用不可见,二者有机结合,从而使原始数据在无需出域与归集的情况下,实现多节点间的可信协同计算和数据隐私保护。同时,能够解决大数据模式下存在的数据过度采集、数据隐私难保护,以及数据储存单点泄露等问题。
区块链——数据可见不可得
区块链技术只能释放出数据对应的信息,把数据对应的价值牢牢握在手中。链上的每个主体都能够看到链上的数据信息,但任何人都无法对其进行复制和篡改,该数据对应的价值始终在链上。
隐私计算——数据可得不可见
隐私计算技术只释放数据可以产生的价值,数据对应的信息则加密不公开。每个人都可以利用数据进行计算获取价值,但数据本身仍然控制在所有者手中。
对于区块链而言,需要借助使用场景和其他技术才能最大程度发挥效应,而隐私计算则成为区块链完美的“借力点”之一。反过来,将区块链技术对计算的可信证明应用到隐私计算中,则可以在保护数据隐私的同时增强隐私计算过程的可验证性,两者相辅相成,能够实现更广泛的数据协同。
5、应用畅想
金融机构对数据价值融合的需求强烈,区块链融合隐私计算在金融领域已经开展局部试点,但由于产业、技术、应用仍在不断探索,目前尚没有大规模成熟应用的案例,最主要的应用探讨集中在联合建模、联合风控、联合预测等场景。下面以机构间联合风控为例,进行介绍。
风控是金融机构的核心业务。出于数据安全及商业保密性的考虑,不同机构间数据往往互相割裂,自建高墙,不愿进行数据共享,导致用户风控指标精准度低,不仅出现多头共债等问题,也难以依据零散、缺失的数据对企业进行精准信用评估。一方面,银行风控难、放款成本高,另一方面,中小企业面临融资难、融资贵的困境。
区块链融合隐私计算,在金融风控场景具有巨大的潜力。各机构对数据进行加密上链,利用区块链所提供的数据与业务不可篡改、合约自动化执行的特点,确保数据可追溯、可验证,便于监管审计,提高违约成本和机构公信力,保障数据的合法合规使用。同时,各方的多维数据可在隐私计算的保障下,安全合规地多次开放共享,进行联合模型训练,提高风控模型的精准度。
联合安全计算数据指纹上链流程

总 结
在金融机构数字化转型的过程中,要发挥数据要素的倍增作用,隐私计算和区块链技术可谓天生一对。聚均科技为金融机构产业金融服务数字化转型提供整体解决方案,自研出金融级联盟区块链底层平台,建立跨主体数据安全共享隐私计算平台,在保障原始数据不出域前提下规范开展数据共享应用,达到数据价值实现与数据安全合规之间的平衡,赋能金融机构高质量发展。
参考文献:
【1】隐私保护:智库百科
【2】腾讯公司:《腾讯隐私保护白皮书》
【3】中国信息通信研究院:《区块链白皮书(2019)》
【4】交通银行:《隐私计算金融应用蓝皮书》
【5】秒钛科技:区块链4要素模型帮助判断场景适配
【6】北京金融科技产业联盟:《隐私计算技术金融应用研究报告》