数字化时代,数据成为重要的生产要素,也是银行数字化经营和风险控制的关键。但在现实生活中,数据产生于不同的场景,金融机构往往需要从众多机构实体中获取海量数据以支撑业务体系。
2021年国家出台《数据安全法》《个人信息保护法》等系列法案,填补数据保护领域的空白。人民银行也颁布《征信业务管理办法》,明确金融行业征信业务数据使用原则、信息采集、使用规范、监督管理等相关要求。数据直接在实体间转移、交换,违反了数据安全和隐私保护的相关规定,金融机构、政府部门、互联网企业数据形成彼此无法连通的“孤岛”。为破局“数据孤岛”难题,银行亟需一种新模式,以兼顾数据深度融合利用和数据安全隐私保护。在上述背景下,招商银行开始隐私计算领域探索。
招商银行隐私计算技术应用现状
与传统数据管理方式不同,隐私计算过程中各方机构只有模型梯度或加密信息交互,无需将底层数据直接出域计算,各方仅管理己方数据即可,极大提升安全性并降低数据管理难度。
招行在充分获得用户授权并保障用户隐私的前提下,探索运用隐私计算技术解决金融机构数据共享应用问题,当前已在风控、营销等多个业务场景落地。信贷风控方面,招行与某数据机构合作,联合构建中小企业行为联邦模型,丰富用户画像,对比行内单边企业主模型,效果有一定提升(AR值提升0.11,KS值提升0.08);营销拓客方面,深圳分行“深信贷”项目中联合企业非公开政务数据联邦建模实现客户精准触达,作为招行首个应用隐私计算技术落地的项目,业务放款金额超2亿元,助力中小微企业融资,推动普惠金融高质量发展。
互联互通,连接“计算孤岛”
招行作为数据应用方,需要与不同数据提供方合作。然而这些数据提供方往往部署着不同的隐私计算平台。当前隐私计算厂商研发的平台大多为异构闭源平台,技术实现原理差异较大,造成跨平台无法互联互通,隐私计算原本连接的“数据孤岛”,又演变成“计算孤岛”,给数据应用方带来了系统重复建设和运维成本增加的问题。此外,行内部署的第三方隐私计算平台为闭源实现,随着合作平台数量增加,对行内系统的安全监管也带来了巨大挑战。因此,互联互通成为连接不同隐私计算平台“计算孤岛”的技术最优解。
招商银行在隐私计算跨平台互联互通中的研究与实践
“计算孤岛”问题可通过隐私计算平台间的互联互通解决。隐私计算平台间的互联互通指基于不同设计原理和功能实现的隐私计算平台之间协同完成某一项隐私计算任务的能力,具体指不同隐私计算平台间通过统一规范的系统接口、算法协议、操作流程等实现数据资源和计算能力的交互与协同,解决使用不同隐私计算平台的数据提供方和数据应用方之间的协作问题。
隐私计算跨平台互联互通的意义有三点:首先,数据、模型、场景可跨平台共享,便于共同构建隐私计算生态网络,可支持平台越多,越易扩展生态网络,极大简化技术对接流程;其次,对于有指定隐私计算平台的数据合作方,可在不要求其必须本地部署行内平台的前提下,快速落地业务场景;最后,各家金融机构使用同一套互联互通标准有助于监管部门统一管理,提升隐私计算的安全性和规范性。
招行自研“慧点”隐私计算平台,已通过中国信通院相关技术评测。为解决新的“计算孤岛”问题,招行结合当前业内主流隐私计算平台互联互通方法和行内实际案例,从技术能力、行业影响力、数据覆盖范围等多维度选择了几家头部隐私计算技术服务商,实现了招行“慧点”隐私计算平台与多厂商跨平台的互联互通。
1.招商银行隐私计算跨平台互联互通技术方案。隐私计算跨平台互联互通应以“求同存异”为原则,关注跨平台协同能力基础环节的标准化,同时也需兼顾个性化和可扩展性。结合当前业内主流的互联互通方法,招行根据实际情况,拟定了“可插拔式平台框架+算法组件架构”的技术方案。其实现需要两步:
(1)多方异构隐私计算平台管理系统互联互通。各方搭建可插拔式平台支持算法组件即插即用,并在平台层面使用同一套协议规范进行互联互通。不同平台服务商可插拔式平台间对算法本身的设计不作定义,而对算法基本信息、输入输出协议规范定义,使算法可通过算法组件形式在平台上使用,同时定义不同平台间的认证互联、存证互联等协议。
机构方A、B为使用了不同隐私计算平台的两个参与方。两方均设计成可插拔式平台架构,分别包含节点认证、数据管理、算法组件、可信存证、安全认证模块等。规范流程如下:首先,数据模块使用同一套数据输入协议,将标准格式入模数据送至算法模块;然后,算法模块采用算法组件方式部署至两方平台,算法组件彼此间采用独立于平台的算法互联互通策略实现平台互通;最后,两方分别使用同一套数据输出协议,获得算法模块的标准计算结果。两方平台使用同一套认证互联协议和存证互联协议。
(2)多方异构隐私计算平台算法组件互联互通。算法组件因其特殊性,互联互通策略不尽相同,对此项目组设计并落地了算法层面互通的白盒模式和黑盒模式,供实际场景灵活选择。
图算法组件互联互通的白盒、黑盒模式
一是算法组件白盒模式。对于公认的算法(如经典逻辑回归、XGBoost算法等),这些算法设计是公开透明的,可进行最小粒度的分解,实现计算原语的抽象和定义,不同平台之间根据协议各自实现己方算法组件模块,分别放在己方可插拔式平台上,实现互联互通。图中白盒模式所示是一个经典逻辑回归算法互通流程。由于该算法实现是公开的,双方可对该模型算法步骤、计算公式、传输内容、变量格式等部分进行最小粒度的约定形成统一算法协议,双方再遵循该协议各自开发算法组件,分别放置己方平台使用,实现算法互联互通。目前,招行与四家厂商平台已经完成了经典逻辑回归白盒算法的互联互通。跨平台互联互通也应保留个性化和可拓展性,保护不同平台自有知识产权的算法原理,不完全公开底层算法的设计原理和代码实现,所以上述白盒模式仅适用于一些经典通用的算法。
二是算法组件黑盒模式。为使用各平台自研算法模块,项目组还设计了黑盒模式。如图黑盒模式所示,自研核心算法作为一个黑盒,该算法组件仅由所有方独立开发,因事先约定了各自可插拔式平台对算法组件的输入输出协议规范,因此所有方算法组件可作为组件直接部署至双方平台上使用,由于各方的算法组件为同一家厂商开发,所以算法模块之间互联互通也不会存在问题。
2.招商银行跨平台互联互通实践及企业标准。隐私计算跨平台互联互通已逐步成为行业共识。中国信通院、人行金标委、信安标委等组织机构,正联合各大隐私计算厂商及应用机构,积极为跨平台互联互通制定行业规范。鉴于互联互通工作在金融行业刚刚起步,需金融机构实际项目进行落地支撑。
招行“慧点”隐私计算平台利用“可插拔式平台框架+算法组件架构”方案,已与洞见科技、富数科技、平安科技、同盾科技四家企业实现了异构隐私计算平台互联互通。为对行内场景规范化管理,招行还制定了《招商银行隐私计算跨平台互联互通企业标准》并对外发布。该企业标准为各家金融机构提供一个可执行的、安全的、规范化的互联互通落地参考标准,有利于推动隐私计算金融行业发展进入平台互联、生态互通的2.0时代。
隐私计算跨平台互联互通展望
招行已落地的跨异构平台互联互通及企业标准可作为金融行业实际案例参考,帮助各金融机构打通不同业务和数据合作生态,推动数据价值安全流通,有助于隐私计算互联互通在金融行业进一步推广。同时也有利于形成可落地的互联互通行业标准,方便人行落实金融监管,有效促进金融业务和金融科技的守正创新,以向善科技助力数字经济高质量发展。
(招商银行隐私计算互联互通项目组成员:招商银行傅杰、葛明嵩、焦惠芸,洞见科技姚明、何浩、李博,富数科技卞阳,平安科技王健宗,同盾科技彭宇翔等。)
《金融电子化》简介
《金融电子化》创刊于1993年,是中国人民银行主管,中国金融电子化公司主办,中国银行业监督管理委员会、中国证券监督管理委员会、中国保险监督管理委员会、国家外汇管理局、中国工商银行、中国农业银行、中国银行、中国建设银行、交通银行及其他商业银行、证券公司、证券公司、保险公司等金融机构协办,是我国金融信息科技类主导期刊。
附《金融电子化》期刊正文页: