可信数据空间核心技术有哪些
近日,国家数据局正式印发了《可信数据空间发展行动计划(2024—2028年)》,标志着我国数据要素市场化和数字经济发展的又一重要里程碑。该计划明确提出:
开展可信数据空间核心技术攻关:组织开展使用控制、数据沙箱、智能合约、隐私计算、高性能密态计算、可信执行环境等可信管控技术攻关,推动数据标识、语义发现、元数据智能识别等数据互通技术集成应用,探索大模型与可信数据空间融合创新。推动可信数据空间资源管理、服务应用、系统安全等技术工具和软硬件产品研发,支持打造可信数据空间系统解决方案,培育一批数据技术和产品服务商。依托现有开源平台推动可信数据空间技术开源,建立多方参与的创新孵化机制,提升技术创新研发和扩散转化效率。
可信数据空间的核心技术体系:可信管控技术+数据互通技术
可信管控技术
1. 使用控制(Usage Control)
定义:使用控制技术是一种数据管控手段,它通过预先设置数据使用条件形成控制策略,实时监测数据使用过程,动态决定数据操作的许可或拒绝。
作用:在可信数据空间中,使用控制技术能够确保数据在流通过程中的合规性和安全性。通过控制策略的制定和执行,数据提供方可以精确地控制哪些用户或应用在何种条件下可以访问和使用数据,从而防止数据被滥用或泄露。
2. 数据沙箱(Data Sandbox)
定义:数据沙箱是一种构建在应用层上的隔离环境,它允许数据使用方在安全和受控的区域内对数据进行分析处理。
作用:数据沙箱技术为数据使用方提供了一个相对独立和安全的数据处理空间。在这个空间里,用户可以进行数据分析、挖掘等操作,而不用担心对原始数据造成污染或泄露。同时,数据沙箱还可以限制用户对数据的访问和操作权限,确保数据的安全性和隐私性。
3. 智能合约(Smart Contract)
定义:智能合约是一种基于区块链技术的自动化执行合约,它以计算机代码的形式定义了合约条款和逻辑,并能够在满足特定条件时自动执行。
作用:在可信数据空间中,智能合约可以用于实现数据交换的自动化和可信化。通过智能合约,数据提供方和使用方可以约定数据的使用条件、价格、交付方式等条款,并在满足条件时自动执行合约,无需第三方中介机构的介入。这不仅可以提高数据交换的效率,还可以降低交易成本和风险。
4. 隐私计算(Privacy Computing)
定义:隐私计算是一种允许在不泄露原始数据的前提下进行数据分析和计算的技术。
作用:在可信数据空间中,隐私计算技术可以保护数据提供方的隐私权益,同时实现数据的高效利用。通过隐私计算技术,数据使用方可以在不直接接触原始数据的情况下,对数据进行分析、挖掘等操作,从而提取出有价值的信息。这既保护了数据提供方的隐私权益,又满足了数据使用方的需求。
5. 高性能密态计算(High-Performance Secure Computation)
定义:高性能密态计算是一种结合了密码学、可信硬件和系统安全等技术手段的计算模式,它能够在保证数据隐私和安全的前提下,实现高效的数据处理和计算。
作用:在可信数据空间中,高性能密态计算技术可以支持对敏感数据的安全处理和分析。通过高性能密态计算技术,数据可以在加密状态下进行运算和处理,从而防止数据在运算过程中被泄露或篡改。同时,该技术还可以提高数据处理的效率和性能,满足大规模数据处理和分析的需求。
6. 可信执行环境(Trusted Execution Environment, TEE)
定义:可信执行环境是一种在硬件层面上实现的安全隔离环境,它能够为应用程序提供一个安全、可信的执行空间。
作用:在可信数据空间中,可信执行环境技术可以保护应用程序和数据免受恶意软件、黑客攻击等安全威胁。通过可信执行环境技术,应用程序可以在一个相对独立和安全的环境中运行,从而确保数据的完整性和隐私性。同时,该技术还可以提高应用程序的可靠性和稳定性,为用户提供更好的服务体验。
数据互通技术
数据标识
定义:数据标识技术是一种为数据资源分配唯一标识符的技术手段。通过为每一个数据资源赋予唯一的标识符,可以实现对数据的快速检索与精准定位。
作用:在数据互通技术集成应用中,数据标识技术起到了基础性的作用。它确保了数据在不同系统、不同平台之间的唯一性和可识别性,为数据的共享、交换和流通提供了基础。通过数据标识,可以轻松地找到需要的数据资源,提高数据的使用效率和价值。
语义发现
定义:语义发现技术是一种能够自动分析数据的深层含义及其关联性的技术手段。通过语义发现技术,可以实现对不同来源、不同类型数据的智能索引与关联。
作用:在数据互通技术集成应用中,语义发现技术起到了关键性的作用。它能够理解数据的语义信息,发现数据之间的内在联系和规律,从而为用户提供更加准确、全面的数据服务。通过语义发现,可以实现对数据的深度挖掘和分析,提取出有价值的信息和知识,为决策提供有力的支持。
元数据智能识别
定义:元数据智能识别技术是一种能够在不同格式之间转换元数据的技术手段。元数据是关于数据的数据,它描述了数据的属性、结构、来源等信息。通过元数据智能识别技术,可以实现对元数据的智能处理和转换,确保数据在不同系统间的一致性与可理解性。
作用:在数据互通技术集成应用中,元数据智能识别技术起到了桥梁性的作用。它解决了不同系统、不同平台之间数据格式不兼容的问题,使得数据可以在不同的环境中无缝地流通和共享。通过元数据智能识别技术,可以实现对数据的标准化处理和管理,提高数据的质量和可用性。
三者集成应用的意义
将数据标识、语义发现、元数据智能识别等数据互通技术集成应用,可以打破数据孤岛,促进数据的共享与流通。这不仅可以提高数据的使用效率和价值,还可以为数字经济的发展提供有力的支撑。通过集成应用这些技术,可以构建出更加开放、共享、智能的数据生态系统,推动数据要素的高效流通和市场化配置。
技术工具和软硬件产品研发
为了支撑可信数据空间的建设和应用,还需要推动相关技术工具和软硬件产品的研发。这包括可信数据空间资源管理技术、服务应用技术和系统安全技术等。通过研发这些技术工具和软硬件产品,可以构建出高效、安全、可扩展的可信数据空间系统解决方案,为数据要素的市场化配置提供有力支撑。
推动技术创新和扩散转化
为了加快可信数据空间核心技术的研发和应用,《行动计划》还提出了一系列保障措施。首先,依托现有开源平台推动可信数据空间技术开源,建立多方参与的创新孵化机制,降低技术门槛,促进技术创新和扩散转化。其次,加强人才培养和引进,支持高等院校、职业学校加强相关专业建设,强化校企联合培养,为可信数据空间的发展提供人才保障。此外,通过加强标杆引领和推动交流合作,打造一批数据资源丰富、价值凸显的可信数据空间标杆项目,推动跨空间、跨域的数据产品和服务交流共享。