隐私计算互联互通发展现状与展望
摘要:自2019年10月党的十九届四中全会将数据增列为生产要素以来,中央、各部委、各地方陆续出台一系列的战略、规划和政策,关于数据资源整合共享、开发利用、安全治理、市场化配置等方面的数据要素体系化顶层设计拉开序幕。在国家层面,2020年4月,《关于构建更加完善的要素市场化配置体制机制的意见》中明确提出了数据要素市场制度建设的方向和重点改革任务;2022年12月,《关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)明确了数据基础制度体系和基本架构,提出建立保障权益、合规使用的数据产权制度,建立合规高效、场内外结合的数据要素流通和交易制度,建立体现效率、促进公平的数据要素收益分配制度,建立安全可控、弹性包容的数据要素治理制度;2023年2月,《数字中国建设整体布局规划》中指出要夯实“数字中国”建设基础,一是要打通数字基础设施大动脉,二是畅通数据资源大循环;2023年10月,国家数据局正式挂牌,这意味着国家将进一步加快全国统一数据大市场建设,推动数字经济加速发展。
近年来,隐私计算作为数据安全流通的关键技术之一,在政策和市场需求的驱动下高速发展,在金融、政务、医疗等诸多场景从试点验证走向了商业应用。但是,随着隐私计算技术的逐步落地,业界数百款产品也衍生出了新的应用挑战。由于当前大多数企业研发的隐私计算平台处于闭源状态,且大多采用不同的系统架构,各个平台之间的差异性较大,从而导致多方在进行跨不同隐私计算平台的计算任务时,存在互联互通难的问题。隐私计算跨平台互联互通的壁垒或使“数据孤岛”变成“数据群岛”,不利于技术的大规模推广应用,是产业内迫切要解决的关键问题。本文将从概念内涵、实现路径、实践案例、标准规范等方面,对隐私计算跨平台互联互通的行业现状和未来发展趋势进行分析,期望为更好地激发数据流通产业活力提供参考。
01
隐私计算跨平台互联互通的内涵及实现路径
跨平台互联互通的内涵
要解决隐私计算跨平台互联互通的问题,首先要厘清其概念和含义。吕艾临等从互联互通的含义、客观对象、目标形态3个方面进行了深入分析。他们指出,隐私计算互联互通是指具有不同系统架构或功能实现方案的隐私计算平台之间通过统一规范的接口、协议等实现跨平台的数据、算法、算力的交互与协同,以支持部署不同平台产品的用户共同完成同一隐私计算任务。其中,有4个关键点要特别注意。一是隐私计算平台并非针对某一类技术平台,而是包括多方安全计算、联邦学习和可信执行环境三大类技术平台以及3种技术交叉融合的平台;二是“跨平台”中的平台,可以指同一平台的不同版本,不仅仅指不同开发者设计的产品平台;三是互联互通强调协同,需要尊重各方产品的设计思路和系统框架,不能强硬地要求所有平台产品统一化和标准化;四是能够协同完成同一个计算任务,需要在节点、数据、通信、算法和应用等层面进行相互链接。
互联互通的实现思路
在理解了互联互通含义的基础上,互联互通的实现方案就需要在保证各技术平台自主性、完整性的基础上对实现互联互通的基础环节求同存异。从互联网技术的发展或者现实经验出发,本文认为标准化是实现互联互通的最佳方式。在通用标准层面,以互联网标准协议为例,从1940年首台图灵机的诞生,到1954年Transciver收发器问世形成的星状网络,到由4所大学组成的实验网络APRANet,再到1983年才通过标准的TCP/IP协议簇构建的如今互联网。在行业标准层面,如移动通信从2G、3G、4G到5G,国际标准也在逐渐统一,银行卡跨平台交易、物联网跨平台接入等也通过标准化的协议约定实现互联。
因此,参考已有的协议和业界实践,隐私计算跨平台互联互通的标准化实现思路可以从“通信协议—计算交互—应用任务”3个层次进行规范:在通信层约定参与交互的节点间的通信规则,包括通信框架、通信消息等内容;在计算交互层约定跨平台任务协同的基础协议,在节点互联、数据互联、算法组件互联等方面达成共识;在上述互联的基础上,应用层则通过约定计算任务协同管理和具体应用步骤、算法场景等内容实现多方的协同交互。
隐私计算任务中最关键的步骤是算法组件的加载和执行。因此,在计算交互层,根据算法组件是否由同一开发者提供,实现互联互通的方式大致可以分为两种(见图1)。
图1 跨平台算法迁移和跨开发者算法对齐
一种是跨平台算法迁移,即由同一开发者提供的算法组件以插件的形式部署于不同的隐私计算平台,实现相同算法组件跨平台间的互通和版本兼容。业界也将这种方式称为“黑盒互联”或“算法调度互联”。
另一种是跨开发者算法对齐,即由不同开发者分别提供算法组件,按照规范的算法流程和实现方式约定的数据交换协议,实现跨平台的算法互通。业界也将这种方式称为“白盒互联”或“开放算法互联”。
根据这两种思路,在各参与方协商对齐节点、数据等资源和通信要求的基础上,算法互联的方式从调度层到算法层,可以按照“异构一层、规范一层”的思路进行推进。这两种方式在具体实践过程中可以根据实际需求进行选择,也可以综合应用。经本文分析,这两种方式的差异点如表1所示。
02
隐私计算跨平台互联互通的行业进展
企业互联互通实践进展
自2021年开始,业内不少技术厂商和行业组织陆续推进探索隐私计算跨平台互联互通,在标准、试验验证、试点案例等层面都取得了进展。通过汇总梳理行业实践案例(见表2),本文从案例类型、参与企业等方面综合分析跨平台算法迁移(简称“黑盒互联”)和跨开发者算法对齐(简称“白盒互联”)两种不同互联方式的应用探索情况。
在案例类型方面,图2(a)为近3年的互联互通案例总体数量,图2(b)为近3年黑盒互联案例和白盒互联案例的类型分布。总体来看,案例数量呈现上升趋势。其中,黑盒互联案例数量基本变化不大,保持在每年3~5个案例的水平;但是,白盒互联案例却逐年增多,占比由最初的25%上升到63%,算法类型覆盖安全求交、逻辑回归、多元线性回归、决策树模型等两方联合分析和联合建模的常用算法。
图2 案例总数变化及案例类型分布情况
在参与企业数量方面,图3(a)为近3年参与互联互通实践案例的企业总体数量,图3(b)为近3年参与黑盒互联案例和白盒互联案例的企业数量分布。从总体数量来看,逐年递增趋势明显,目前已覆盖24家企业,约占隐私计算厂商总数量的16%(根据公开材料,目前隐私计算企业数量约150余家)。从中可以看出,隐私计算互联互通正在成为业界的关注热点,并且基于实际业务需求,开展试验验证的企业越来越多。从图3(b)可以看出,参与白盒互联案例的企业虽然比参与黑盒案例的企业少,但也呈现逐年增加趋势,目前约占总量的30%。
图3 企业总数及参与不同案例类型的企业数量分布
在参与企业类型方面,图4(a)统计了近3年参与互联互通案例的企业类型分布变化情况,图4(b)为2023年各种类型企业的分布情况。总体来看,目前参与隐私计算互联互通实践案例的企业主要包括通信运营商、金融机构(从业务应用角度出发,包括银行、保险公司等机构及其下属的科技公司,以区别于一般的技术企业)、互联网企业、隐私计算技术企业4种类型。通信运营商主要是中国电信、中国移动和中国联通;金融机构主要是工商银行、浦发银行、招商银行等机构;互联网企业主要是蚂蚁集团、百度等;隐私计算技术企业主要是洞见科技、富数科技、蓝象智联、金智塔等隐私计算领域的专项技术服务型企业。从图4(a)可以看出,金融机构和通信运营商在互联互通案例的参与度上数量逐年上升,对突破跨平台互联互通的技术瓶颈、助力业务开展的需求更加强烈;从图4(b)可以看出,2023年隐私计算技术厂商的占比已经接近60%,后续将会有更多此类厂商参与到互联互通的验证和应用中。
图4 企业类型分布情况
行业标准规范进展
技术应用需要统一的标准规范划定基线,随着隐私计算技术不断落地应用,标准研制工作也在紧锣密鼓地开展。从电气与电子工程师协会(Institute of Electrical and Electronics Engineers,IEEE)等国际标准化组织到全国信息安全标准化技术委员会、中国通信标准化协会(China Communications Standards Association,CCSA)、北京金融科技产业联盟和隐私计算联盟等国内标准化组织都在积极组织行业专家制定隐私计算互联互通的相关标准规范(见表3)。互联互通的标准规范不仅是技术或能力上的要求,更需要通过统一的接口协议来引导行业实践,为技术研发和改造提供可落地的参考。
在技术要求方面,CCSA的标准主要从技术能力上对隐私计算跨平台互联互通中涉及的各个环节(包括术语定义、互联方式、通信、算法、应用等具体内容)进行规范,同时在附录部分给出一些常见算法(如求交、查询、统计和建模)的参数示例。
在接口规范方面,隐私计算联盟发布的开放协议系列文件,对常用算法的流程、协商握手过程和算法运行阶段的通信格式、通信内容和字段进行了规范,并在隐语开源社区给出了参考。此外,北京金融科技产业联盟组织了相关课题的研究和验证,在FATE仓库以及隐语开源社区发布隐私计算互联互通接口技术文档v1.0版本,为互联互通落地验证提供依据与支撑。
03
隐私计算跨平台互联互通的未来展望与建议
积极探索可落地的技术实施方案
隐私计算互联互通是着眼于广阔的数据要素流通前景,构建基于隐私计算的数据流通基础设施,推动数据流通基础设施建设落地的必要环节。目前,业界在标准规范、试点验证方面都开展了诸多工作,但是仍处于小规模的试点阶段,对于大规模的推广和建立成熟的商业应用模式还需不断努力。
究其原因,一方面隐私计算是跨学科的新兴领域,涉及密码学、分布式计算、人工智能、数据科学等众多技术,包含多方安全计算、联邦学习、可信执行环境等不同的技术路线,即使最简单的安全求交运算就存在数十种的算法可以实现,算法实现的多样性和复杂性对跨平台互联互通带来了新的挑战;另一方面,在隐私计算技术面向不同场景应用时,还需要根据业务需求进行定制化开发,各厂商开发的产品系统都存在个性化的设计功能,由此也进一步增加了跨平台互联互通的改造适配成本。因此,仍要积极探索关键技术的实施方案,降低改造成本和应用门槛,在充分考虑和尊重各方产品设计、技术路线差异的基础上,从黑盒互联和白盒互联两种方式出发,既充分研究不同的实现方案,也尽量从解耦的角度出发,优先解决互联互通的难点、痛点,加快推进应用可行性方案研究。
多方协同探索形成良好互联生态
由于隐私计算技术发展尚未成熟,要实现技术产品互联互通乃至形成互联生态仍需要多方协作共同探索。一方面,亟需技术提供方、技术应用方的持续探索,才能在最大程度降低改造成本、减少对平台技术影响的基础上,允许技术平台动态地自由加入或退出互联互通网络,从而构建完善的生态网络,助力数据安全流通,满足多方数据融合的应用需求;另一方面,也需要检测机构、标准化组织等推动统一的标准和检测认证体系,依据相关标准建立检测平台和方法,明确评估技术产品的互联互通能力,为应用方提供选型依据,从而提高和规范行业水平。
互联互通有望加速数据流通设施落地
根据业界初步研究,数据基础设施是面向社会提供一体化数据汇聚、处理、流通、应用、运营、安全保障服务的一类新型基础设施,数据流通设施作为其中关键的一环,发挥着不可替代的重要作用。其中,以隐私计算为代表的“数据可用不可见”的可信数据流通技术,专注于对数据使用过程和计算结果的隐私保护,在保证数据安全的前提下实现多方数据融合的价值最大化。因此,通过推动隐私计算跨平台的互联互通,不仅能够促进隐私计算技术的落地应用,也能够促进全国范围内跨地区、跨行业和跨主体的数据安全流通。
04
结 语
本文通过系统梳理隐私计算互联互通在概念范畴、企业案例实践和行业标准规范等方面的最新进展,对互联互通的实现思路和方式进行了深入分析,同时也从技术攻关、产业生态和基础设施等方面展望了其未来发展方向。本文基于当前公开资料开展的调研与分析,内容尚不充分,未来需持续扩大调研对象和调研范围,进一步丰富研究成果。在产业各方的共同努力下,隐私计算技术的可用性有望进一步提高,应用场景也将不断丰富和扩展,跨平台互联互通的技术门槛将持续降低,多方数据融合的范围也将不断扩大,从而加快推动数据流通产业的高质量发展。
声明:本文来自微信公众号“米可维大数据”,版权归作者所有。文章内容仅代表作者独立观点,不代表本公司立场,转载目的在于传递更多信息。