隐私集合求交测试数据集
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=67d51112195d260905af9eb1&type=1
下载链接
链接失效反馈官方服务:
资源简介:
数据内容:为了平衡数据隐私性保护与验证所需的数据公开性之间的矛盾,提出了基于区块链的可公开验证的隐私集合求交协议,该协议可以使得参与方能够在不泄露双方数据的情况下求得他们的交集,从而实现数据的“可用不可见”。为了验证基于该协议在不同场景下的时间及空间复杂度,模拟生成了不同数量大小的测试数据集。原始的测试数据集主要包含用于测试的各种大小的服务端身份证号数据集以及客户端身份证号数据集。这些身份证号按照国家规定的规范格式随机生成,每条数据都由以下6个部分依次拼接而成:6位的区域码、8位的出生日期(限定1960-01-01到2000-12-30这段日期)、2位的顺序码、1位的性别码和1位的校验码共18个字符组成。为了模拟非平衡求交的场景,所生成的服务端数据集大小远大于客户端数据集的大小,其中服务端的数据集大小从低到高为216,220,224,228,客户端的数据集大小从低到高依次为28,29,210,211,212。除了原始数据集,还包括算法执行过程中所生成的服务端布谷鸟过滤器二进制文件、客户端盲化数据集、服务端盲签名数据集、客户端解盲数据集、最终结果数据集,以及所记录的Merkle根、通信大小、计算时间等数据。
数据来源: 1. 2023年1月12日至2023年1月27日根据算法运行真实环境下采集的真实服务器配置数据;2. 2023年1月12日至2023年1月27日根据Python脚本所生成的随机身份证号数据集,包括服务端和客户端两部分3. 2023年1月12日至2023年1月27日运行算法所生成的中间过程数据以及所记录的通信大小和计算时间。
分析手段:将所提协议运行在上述不同的数据集大小上,并在算法执行过程中计算出所生成文件的字节数、通信过程中传输的字节数、相应阶段的程序运行时间,并将这些数据通过控制台输出,分别作为存储量、在线通信量、计算时间的结果。对于证明大小,通过额外的python脚本进行生成,并在脚本中计算所生成证明所需的字节数。对于智能合约的Gas消耗,通过将证明上传至区块链平台,并执行合约中的证明验证方法,得到所消耗的Gas。得到不同数据集下的存储量结果后,通过表格的形式展示存储量随服务端数据集的大小变化。得到在线通信量、计算时间、证明大小和Gas消耗的结果后,将其写入相关的python脚本代码,通过代码的形式生成折线图,其中横坐标为客户端的数据集大小,采用对数坐标,纵坐标为相应的测试结果,从而直观展示不同客户端数据集大小下的在线通信量、计算时间、证明大小和Gas消耗。
对考核指标的支撑性:这些数据集可用来对算法进行测试,分析在不同大小数据集上的链上和链下的时间以及空间复杂度。主要指标包括:1)服务端加密数据的空间复杂度;2)双方的在线通信复杂度;3)服务端、客户端的离线和在线计算复杂度;4)可公开证明的空间复杂度;5)合约的验证复杂度
通过将服务端数据集大小从低到高依次变更,可以得到相应的布谷鸟过滤器二进制文件,进而计算出不同服务端数据集大小下所需的存储量,从而支持指标1)。通过将客户端数据集大小从低到高依次变更,从而可以得到相应的客户端盲化数据集和服务端盲签名数据集,进而计算出不同客户端数据集大小下的在线通信量,从而支持指标2)。通过将客户端数据集大小从低到高依次变更,可以测量出服务端在线阶段、客户端离线和在线阶段分别的计算时间,从而支持指标3)。通过将客户端数据集大小从低到高依次变更,可以生成merkle路径长度不同的证明,从而支持指标4);将不同merkle路径长度的证明上传至智能合约进行验证,并测量出合约执行所消耗的Gas,可以支持指标5)。该数据集可以支撑论文《Blockchain-Based Unbalanced PSI with Public Verification and Financial Security》中的算法及结论。
数据集之间的关联:本数据集与数据集(1)和数据集(2)都归属于隐私保护数据集,共同服务于细粒度、高性能动态可穿透式监管的隐私保护机制和方法。但本数据集中的每条身份证号模拟的不是双方的身份,而是服务端和客户端各自拥有的数据,目的是模拟对数据而非身份进行隐私保护。
采集方案:实验过程中记录到文件系统中
时间及地点:2023年1月12日-1月27日,同济大学
设备情况:PSI协议运行所需设备包括客户端设备和服务端设备,其中客户端设备的配置信息为:CPU型号为Intel i5-8300H、内存大小为8G、内核数量为4,逻辑处理器数量为8;服务端设备的配置信息为:CPU型号为Intel i7-10510U、内存大小为16G、内核数量为4,逻辑处理器数量为8。
提供机构:
同济大学



