Diffusion-CIFAR-10图像生成流数据集
收藏国家基础学科公共科学数据中心2026-05-20 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6a09e60ff175603f068efa6c&type=1
下载链接
链接失效反馈官方服务:
资源简介:
流数据计算理论的算法验证是大数据处理领域的核心研究基础。然而,在实际研究中,面向流式计算算法的评测常面临基准数据静态化与时序演化特征缺失的双重制约。针对上述问题,本研究以预训练扩散模型的逆向去噪采样过程为数据来源,以CIFAR-10所定义的10个语义类别为语义分布基础,完整记录每张图像从随机高斯噪声经1000个离散去噪时间步逐步成形的全链条中间状态序列,构建了面向流数据计算理论验证的大规模动态图像基准数据集。每条记录固定长度3074字节,包含当前时间步图像张量的向量平方L2范数与32×32像素RGB图像数据,像素通道排布与编码规范与CIFAR-10原生二进制格式完全兼容。本数据集在体量与时序维度上显著超越原始静态CIFAR-10数据集,可直接适配矩阵素描、流式近似算法、在线低秩近似等流数据算法的验证需求,亦可支撑扩散模型中间过程表征分析与加速采样方法研究,为流数据计算理论的实验评测提供关键的大规模动态基准数据基础。
提供机构:
中国人民大学



