激励代码是什么(激励是什么-)

六年磨一剑,2022年7月4日,蚂蚁集团宣布可信隐私计算框架“隐语”面向全球开源。此次开源发布会由中国信通院隐私计算联盟支持,并邀请中科院院士、密码学家王小云,中国银行业协会首席信息官高峰、中国信息通信研究院云计算和大数据研究所所长何宝宏等多位嘉宾出席。

隐私计算 ,前世今生

隐私计算是多学科交叉的技术领域,是在保证不泄漏原始数据的条件下,对数据进行分析与计算,从而实现对数据价值的提取和利用的技术。作为一个新兴的技术领域,隐私计算涉及到密码学、人工智能、BI分析等领域,包括多方安全计算(MPC)、联邦学习(FL)、可信执行环境(TEE)、可信密态计算(TECC)等众多专业技术路线。

隐私计算的提出,最早可以追溯到1982年,姚期智(中科院院士,2000年图灵奖得主)在当时提出了著名的“富翁问题”:有两个百万富翁,如何在保护好双方隐私,不让对方或者任何第三方知道自己财富的同时,各自计算出谁更富有?基于这个看似无解的“悖论”,姚院士提出了“多方安全计算(MPC)”的概念。随后,越来越多的学者投入到该领域的研究,并由此发展出一系列的技术方案,隐私计算技术也因此而逐渐壮大。

近年来,随着各行各业对数据合规流通与合法保护的需求逐渐强烈,越来越多的隐私计算商业模式与项目开始出现。譬如,中国信息通信研究院于2021年发布了《隐私计算白皮书》,聚焦该技术的发展态势和应用场景,对隐私计算技术合规实践路径进行了探索,对其面临的挑战与困难进行了分析,并对该技术未来的发展方向指明了道路。

在国家政策扶持下,蚂蚁集团自2016年起,以开放、安全为核心理念,自主研发了名为“隐语”的隐私计算平台,不断推进隐私计算技术及其规模化应用,并针对行业内数据安全、数据孤岛等痛点问题提出了多项创新解决方案。

从技术上讲,“隐语”的平台架构可以自下而上分为五层:资源管理层、明密文计算设备与原语层、明密文混合调度层、AI&BI隐私算法层、用户界面,如下图中所示。

“隐语”平台技术架构图

资源管理层:主要承担了两方面的职责。第一是面向业务交付团队,可以屏蔽不同机构底层基础设施的差异,降低业务交付团队的部署运维成本。另一方面,通过对不同机构的资源进行统一的调度和管理,解决了生产场景中的大规模和高可用问题。

明密文计算设备与原语层:提供了统一的可编程设备抽象,将多方安全计算(MPC)、同态加密(HE)、可信硬件(TEE)等隐私计算技术抽象为密态设备,将单方本地计算抽象为明文设备。同时,提供了一些不适合作为设备抽象的基础算法,如差分隐私(DP)、安全聚合(Secure Aggregation)等。未来当有新的密态计算技术出现时,可以通过这种松耦合的设计集成进隐私框架。

明密文混合调度层:这层一方面对上层提供了明密文混合编程的接口,同时也提供了统一的设备调度抽象。通过将上层算法描述为一张有向无环图,其中节点表示某个设备上的计算,边表示设备之间的数据流动,即逻辑计算图。然后由分布式框架进一步将逻辑计算图拆分并调度至物理节点。

AI & BI 隐私算法层:这一层的目的是屏蔽隐私计算技术细节,但保留隐私计算的本质,目的是降低隐私计算算法的开发门槛,提升开发效率。有隐私计算算法开发诉求的开发者,可以根据自身场景和业务的特点,设计出一些特化的隐私计算算法,来满足自身业务和场景对安全性、计算性能和计算精度的平衡。在这一层上,隐语本身也会提供一些通用的算法能力,比如MPC的LR/XGB/NN,联邦学习算法,SQL能力等。

用户界面层:隐语的目标并不是做一个端到端的产品,而是为了让不同的业务都能够通过快速集成隐语而具备全面的隐私计算能力。因此隐语会在最上层去提供一层比较薄的产品API,以及一些原子化的前后端SDK,去降低业务方集成隐语的成本。

“隐语”框架的开源协议基于Apache-2.0,鼓励代码修改与共享,并尊重原作者的著作权。目前,“隐语”已向社区开放了多方安全计算和联邦学习的核心代码,相关算法/模型开发者可以使用隐语提供的编程能力,得到数据与隐私保护。对于底层安全开发者,可将底层密码/安全研究成果嵌入隐语,完善密态设备的能力、性能和安全,并进行实际业务应用的转化。

“隐语”平台,价值何在

在隐私计算需求日益增长的“数据密态”时代,各个行业的应用场景交叉复杂,单一的隐私计算技术框架难以适用,往往需要多条技术路线相结合的解决方案。而面对新场景,数据安全难以保证且技术方案需要从头开发,成为了隐私计算迈向大规模应用的障碍之一。

经过多年发展,“隐语”平台在蚂蚁集团内部以及外部金融、医疗等场景下实现了规模化应用。该平台以安全、开放为核心设计理念,内置多方安全计算、联邦学习、可信执行环境和可信密态计算等多种技术及虚拟设备。

通过良好的分层设计、安全的隐私保护功能,以及丰富的算法模块,“隐语”降低了隐私计算领域开发者的技术门槛,有助于将该技术推广到大数据分析、商务智能等大规模实际应用场景中。

“隐语”平台的价值主要集中在以下几个方面:

技术开放性:允许多方协同参与隐私计算技术开发,通过明密文编程范式及丰富的算法功能,使得不同背景的开发者都能参与隐私计算算法的开发。技术联通性:采用混合协议设计,解决不同隐私计算技术之间数据难以联通的问题,为大型数据网络的构建创造了环境。技术完备性:该平台支持所有主流的隐私计算技术,消除了各技术领域研究优劣势的问题,并且允许对各种技术进行创新与组装,以适应不同场景的需求。。

“隐语”平台具备卓越的数据安全性与功能性,在蚂蚁集团内部业务及外部金融、医疗等场景有成功的落地经验,入选了中国网络空间安全协会 “数据安全典型实践案例”和工信部2021年大数据产业发展试点示范项目名单,并获得了中国信通院颁发的“星河案例奖”,中国计算机学会颁发的科学技术奖和科技进步优秀奖等一系列荣誉。

开源之后,走向何方

可以预见,随着“隐语”的开源,该隐私计算平台将有机会探索更广阔的发展空间,联合高校、企业等机构,吸纳各行各业对于隐私计算技术发展的贡献,适应当前数字化社会发展对隐私计算技术高速迭代的需求。

围绕开源社区,“隐语”将会逐渐普及隐私计算技术,通过开放的交流环境,促进领域内各个技术之间的融合,实现技术的互联互通与强强互补,实现各个技术的价值最大化与加速发展,为隐私计算技术的生态构建打下良好基础。

现阶段来看,隐私计算技术还属于相对前沿的探索领域,真正实现大规模的落地应用尚且处在地平线上,在功能全面性和工业化、标准化、规模化等方面都还有较大的发展空间。通过开源,蚂蚁集团的“隐语”将有望为各行各业的数据流通与数据安全环节做更多应有的贡献。

设立基金,探索未来

在本次发布会上,除了开源“隐语”以外,中国计算机学会秘书长唐卫清、蚂蚁集团副总裁兼首席技术安全官韦韬共同宣布,联合设立“中国计算机学会—蚂蚁隐私计算专项科研基金”,搭建产学研结合的国际合作平台,公开评选与扶持有价值的创新项目,促进学者开展该领域的前沿研究,推进隐私计算的前沿探索与技术应用。

蚂蚁集团联合中国计算机协会设立专项科研基金

该基金在近期内陆续开放多个隐私计算相关的应用论证类与前沿探索类科研项目,包括:“开源隐私计算平台安全性研究”、“后量子多方安全计算研究”和“隐私保护下的端云推荐模型”等课题,并在全球范围内欢迎具备一定创新思维和研究基础的学者共同参与,引领未来,为隐私计算领域合作贡献高质量的研究成果。