9月26日,2023数据要素发展大会在广东省广州市成功召开。本次大会以“激发数据价值,共促要素发展”为主题,邀请政府部门、专家学者、企业代表等共商数据要素发展中的关键问题,为我国加快培育数据要素市场提供思路以及政策建议。会上,中国信通院云计算与大数据研究所白玉真对《公共数据授权运营平台功能要求》(后文简称功能要求)标准进行了介绍。
以下为演讲实录
-标准编制背景-
自2015年《促进大数据发展行动纲要》提出推进公共数据资源开放以来,公共数据的相关内容就持续出现在中央政策文件里。尤其是“数据二十条”中对公共数据确权授权机制、全流程合规与监管体系、分享价值收益方式等内容做出了重要指示。今年公共数据授权运营更是成为了各地方激活数据要素价值的探索热点。例如北京、上海、浙江、海南、杭州、青岛、成都等多地,出台公共数据相关的管理办法、数据条例,成立大数据集团,搭建授权运营平台,开展数据专区的落地案例等。但是,统一的授权运营机制、全流程的标准规范、应用场景挖掘等瓶颈问题仍有待突破。因此,TC601 WG12工作组围绕公共数据授权运营开展课题研究、标准研制与应用创新,促进行业协同。
在此背景下,中国信通院云大所联合地方数据集团、地方数据交易所、数据运营方、技术企业等近40家单位共同编制《公共数据授权运营平台功能要求》标准,旨在为公共数据授权运营平台的研发、测试、评估和验收等提供参考和指引。
功能要求内容
公共数据授权运营平台是指在保证公共数据“原始数据不出域、数据可用不可见”的条件下,通过可溯源授权、可靠供给、可信处理、可控服务与安全等技术,提供数据授权开发与运营全流程服务的技术平台。主要涵盖授权运营管理、数据资源管理、数据产品服务、支撑服务等四大核心功能。本标准首先对公共数据、授权运营平台、公共数据产品服务、相关的参与主体(如数据提供方、平台运营方、授权运营单位、监管方等)进行定义描述,划清概念边界;然后概括四大核心功能的总体技术要求,紧接着针对各个核心能力细化相应技术要求。
总体要求包括两个部分,一是功能概述,结合四大核心功能给出了“三横一纵”的参考架构:
(1) 授权运营管理保障公共数据资源的开发利用合法合规、安全监管有据可循;
(2) 数据资源管理保障公共数据资源安全有效供给;
(3) 数据产品服务保障数据可信加工使用、授权运营单位根据数据使用方的需求提供可控数据产品和服务;
(4) 支撑服务保障数据安全、平台安全和全流程可监管、可记录、可追溯、可审计。
二是,授权运营平台作为数据加工处理的平台,因此宜支持在数据资源、数据应用方面与现有相关平台对接以实现数据交换与应用,包括但不限于政务信息共享交换平台、水电气、公共交通等数据汇聚平台以及数据交易机构平台等。
授权运营管理是为相关参与主体提供授权运营单位管理、个人或企业授权管理、资源使用管理、数据产品管理等功能,并通过统一服务门户进行管理。
(1) 授权运营单位管理强调对授权运营单位信息、人员信息等的认证和管理。
(2) 个人或企业授权管理是面向各类社会应用提供通用的信息授权服务,支持向个人或企业用户展示数据的调用申请方等信息,方便个人或企业管理自身授权信息。
(3) 资源使用管理是对授权运营单位发起的数据申请、加工资源申请等进行管理,包括对数据资源使用情况的查看和统计,对数据资源目录、数据资源、算力存储等加工资源的申请、管理和授权审批。
(4) 数据产品管理是对数据产品的发布、审批、应用情况进行管理,授权运营单位可提出公共数据产品发布申请,审核通过后各类社会应用可正常调用数据产品,授权运营平台可对数据产品的服务情况、应用方等信息进行实时监测。
(5) 以服务门户作为平台对外展示的载体,通过多个维度展现数据资源、数据产品、授权运营单位等信息,推动供需端的数据产品服务磋商,实现技术成果与市场需求的精准对接。
数据资源管理是为相关参与主体提供数据资源接入、数据资源目录管理、数据评估等管理功能,保障公共数据资源安全有效供给。
(1) 数据资源接入功能有助于建立数据资源管理的基础框架,通过数据的规范化接入,提高数据资源的可管理性和可利用性。例如支持多种类型数据源接入、接入后进行验证比对、添加唯一标识符、描述资源属性等内容。
(2) 数据资源目录为用户提供了方便快捷的途径来寻找和获取所需的数据资源,有助于提升用户体验和数据资源的有效利用。例如支持资源进行分类、统计、发布详情展示等。
(3) 数据评估则是应支持平台方协同监管方解决在数据加工处理或提供服务过程中的公共数据质量评估、安全性评估等问题。例如实时监测数据资源的质量,及时发现和反馈数据质量问题,生成数据质量报告,以及对是否存在敏感数据进行识别。
数据产品服务是通过为相关参与主体提供数据汇聚、加工处理、分析挖掘等加工环境和技术方法。同时,在形成数据产品后,对数据产品进行审查、安全交付。主要包括数据产品开发、审查和交付三个环节。
(1) 产品开发环节,平台应提供安全可控开发环境,帮助数据开发者对已授权的数据资源进行加工处理。除了要满足“原始数据不出域、数据可用不可见”的要求外,数据产品的开发还应满足数据访问控制和产品开发控制的基础要求,例如通过数据分级实现仅查看已授权的数据、仅在指定的环境开发,授权到期后环境回收。在加工要求方面,应提供隔离的调试环境和生产环境,提供多种建模工具,可应用数据沙箱、隐私计算、使用控制、区块链等可信数据流通技术来实现数据挖掘分析,并满足相应的技术应用要求。
(2) 产品开发完成后,要通过产品审查才可交付。数据产品的类型多种多样,包括数据接口、数据包、数据模型、数据报告、数据服务等。一方面平台应对数据产品信息的完整性、时效性、一致性、安全性、合规性等进行审查,另一方面也应对特定的数据产品类型,进行特定审查,如对数据接口类产品提供访问控制规则,对模型数据产品提供黑盒测试功能。
(3) 数据产品通过审查后,平台应对数据产品进行安全封装。应通过提供接口标准封装、数据水印等技术手段,实现数据产品的安全交付。同时,也支持授权运营单位可在数据产品列表中查看通过审查、完成交付配置的数据产品。
支撑服务是为相关参与主体提供全流程的支撑保障,包括数据安全、平台安全的必备能力,同时也可扩展提供数据存储、计量计费、监控告警等可选功能。
(1) 数据安全方面,包括制定数据安全保护策略、对敏感信息进行脱敏、计算过程数据保护、数据加密存储和传输、数据备份、封存销毁等功能。
(2) 平台安全方面,包括用户认证和权限管理、全流程监控、网络通信安全、网络隔离、系统安全等内容。
(3) 存储与计算方面,主要是支持多类型的数据存储和离线处理计算、分布式计算等计算能力。
(4) 计量计费方面,支持在数据资源提供、开发、利用、监管等方面进行统计,由此评估各方贡献,便于利益分配和激励机制设计。
(5) 监控告警方面,通过对平台资源运行情况、数据资源用量、任务执行情况、数据产品和服务应用情况等进行监控,对潜在的风险及时发出告警。
致谢及未来计划
在标准的编制过程中,先后有近40多家企业参与讨论,感谢以下各单位相关专家的积极供稿和讨论!
本标准是技术要求,仍需要细化测试方法来落实。目前,测试用例已基本编制完成,于10月开展首批次测试,欢迎大家报名参与。
后续,我们将继续充分发挥TC601和隐私计算联盟的平台号召力,组织行业测试,规范技术应用、产品研发,促进行业快速发展,欢迎和期待更多的专家加入!
文章来源于:《数据资产学习》公众号