2024年10月21日,在中国信息通信研究院(以下简称“中国信通院”)组织的首批数据空间平台能力专项测试中,中国电科集团所属的太极计算机股份有限公司(以下简称“太极股份”)的“太极可信数据空间平台V1.0”完成全部测试内容,成为首家完成此项测试的企业。
标准及测试介绍
《数据空间解决方案能力要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合20余家企业的专家共同编制,旨在为数据空间的平台研发、测试、评估和验收提供参考和指引。
据此标准形成的测试“数据空间平台能力专项测试”覆盖数据资源管理、数据服务支持、数据使用管控、通用安全能力、应用服务支持等共计八大能力域,包含权限管理、供需对接、控制策略、环境安全等十余个子能力域。
产品研发背景
当前,数据快速融入生产、分配、流通和利用等各个环节,已成为数字经济时代中的关键生产要素。随着数据规模化流通与应用不断拓展,数据安全泄露风险不断增大,产品如何通过能力建设和模块组合,满足不同端侧的多样、多级、多层、多域、多体、多属的场景需求,同时实现全域的数据高效治理、数据安全与可控流通成为产品建设重点。
数据空间是实现数据资源共享共用的数据流通利用基础设施,通过一套体系化的技术、标准和规则打造一个可信流通环境促进数据价值释放。太极股份持续研发和迭代数据治理、数据流通、数据应用相关的产品,基于近些年在大数据领域的积累研发形成太极可信数据空间,并开始探索政务、农业、健康、交通、水利、医疗、能源等行业数据空间、城市数据空间和企业数据空间建设,为数据可控、安全、高效流通与利用打造基础。
太极可信数据空间介绍
“太极可信数据空间平台V1.0”以联接数据要素流通相关方,保障数据要素安全有序流通为目标,围绕数据产权、流通交易、收益分配、协同治理等方面,融合加密、数据分类分级、隐私计算、区块链、数字证书、存证与审计等一系列可信技术,打造支撑数据要素流通全过程的可信数据空间,推动跨区域、跨行业、跨机构数据的互联互通和互操作,保障各参与方合法权益,支撑数据要素价值合规、高效释放,助力数据要素市场蓬勃发展。
图1 太极可信数据空间
太极可信数据空间V1.0架构由接入层、存储层、数据处理层、数据控制层、应用服务层、前端应用层组成,可实现大型链总端、监管端的综合一体化需求,也可满足数据供给域、数据流通域、数据应用域的不同用户需求。
接入层支持离线、实时、API、文件等多种接入方式,根据执行任务不同在在数据处理层进行离线或实时数据处理,并完成管理和资源调度等工作;数据控制层可实现同入多途使用管控,通过数据使用控制、隐私计算、数据沙箱等技术实现数据不同级、不同域、不同主体、不同属性等内应用控制策略的匹配与流转,并基于数据控制层能力,用户可在前端进行一体化、可视化的数据开发与运营。
关键能力
1.多源数据接入治理
采用数据标识技术实现各主体间数据的唯一性,提供多标识的解析、数据识别、定位等,平台提供多标识的映射,解决标识跨域识别及跨域定位问题;基于数据唯一标识,形成多维数据资源目录,对外支持数据检索、数据访问、数据和服务等资源的发布与发现,提供接入数据的治理工具及服务,保障接入数据的高效、安全的发现与使用。
图2 多源数据治理
2.数据分类分级
依据国家标准,研制了一套全面且普适的数据分类分级规则体系,平台通过运用知识图谱、机器学习算法和大模型技术,实现高效地对平台内的数据进行梳理、精确分类以及实施分级保护,确保在遵守数据安全法规的同时,满足数据在不同流动场景下的安全防护需求。
图3 数据分类分级管理及使用
3.数据使用管控
平台提供完善的数据流通控制体系,包括接入身份认证、数据访问控制、数据使用管控、数据流通存证等,保障数据空间接入方身份可信,确保数据流通利用全过程的动态管控和数据使用操作可追溯。平台内置数据控制策略集,提供基于数据使用场景、数据在特定事件触发使用、数据使用次数、数据使用终端等多维度组合式数据使用管控能力。通过建立数据空间资源合作规范,保障可信数据空间身份可信、数据资源管理权责清晰以及应用服务安全可信。
图4 使用控制策略与合约制定
图5 数据通过租户、用户权限等进行访问控制
4.数据产品开发交付
平台具备集数据处理、数据加工、模型训练、成果管理于一体的全栈数据开发能力,提供实时开发、离线开发、数据测试等全方位的数据开发环境,支持多租户服务模式,并通过用户信息隔离、数据权限控制、数据安全沙箱、隐私计算服务、日志审计等安全与防护措施实现数据开发利用过程中数据在项目间的隔离使用、数据可用不可见、使用记录可追溯。
图6 数据聚合分析
图7 基于隐私计算方式的数据产品开发
5.数据可信交易
平台面向数据要素流通相关方提供集身份认证、数据/数据产品目录、数据质量评估、交易撮合、审计清算等于一体的数据交易功能,构建以供方交易的登记、评估、审核、上架、合同、支付、交易切割、交易结算,和需方交易订阅、下单、求购、服务、交割两条业务并存的数据交易模式,分别满足供方市场和需方市场的交易需求。
图8 数据产品订阅界面
6.全过程可检测可溯
平台提供可靠的主体身份认证、异常识别、日志存证、审计监管能力,通过完善的身份认证流程保证身份可信,通过实时监测发现数据流通过程中的数据违规使用、通信中断等异常,支持基于IP、时间、人员、账户信息等多维度进行溯源分析统计,形成可视化溯源链路,有效支撑审计监管。
图9 可信主体认证流程说明
应用实践
太极可信数据空间平台目前在交通、工业制造等领域进行了初步试验验证,为行业数据融合利用提供支持。在交通领域,太极股份依托自研可信数据空间平台,在确保数据应用全流程合规、安全的前提下,深入流量仿真、车辆画像、运行监测、路衍经济等主题场景,实现畅通高速、平安高速、区域运营、物流调度、稽核抓逃、车/企风控多项落地应用,为交通行业主管部门、道路业主,以及金融、保险、物流等跨界企业提供有力数据支撑。
在工业制造领域,太极股份联合中电联打造的电力数据空间,通过可信、安全、透明地进行数据共享、交换、流通与交易,对行业实现“双碳”目标和建设新型电力系统至关重要。目前,该平台汇聚了电力统计、电力科技、电力规划、电力工程、国际电力、电力可靠性、电力燃料、电力环保、电力人才等九大类行业数据,打造了1200余份数据报告、400余万条结构化数据和数十项应用产品,为构建电力数据交换、流通、共享提供了安全和可信任的环境。
图10 电力行业构建可信数据空间
未来展望
2024年10月24日,太极可信数据空间在“太极开发者大会”上正式发布V1.0版本,该版本具备数据广泛接入、高效传输交互、可控流通利用、资源开发交付等核心能力。未来,为更好推动数据要素与实体业务的深度耦合,加速以数据要素为核心的数字经济高质量发展,太极股份将继续紧跟国家政策和标准要求,进一步丰富产品使用控制策略维度,加强多类安全技术联合使用,不断迭代完善数据协同治理、数据融合开发利用、数据安全合规管控能力,并探索数据空间与大模型的融合创新。同时,结合不同区域、行业数据空间建设需求,增强产品跨空间的主体身份互认和数据互操作性,为行业数据空间构建、流通利用场景拓展、数据应用生态构建打造坚实基础。