five

1GiB_Entropy_Block_NIST_SP800-22_Dieharder

收藏
Hugging Face2025-08-02 更新2025-08-03 收录
下载链接:
https://huggingface.co/datasets/PalmerEormen/1GiB_Entropy_Block_NIST_SP800-22_Dieharder
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集是一个包含1GiB高质量熵块的专业生成数据集,由Eormen Edge-of-Chaos Engine生成,并经过三个独立测试套件的全面验证,适合用于密码学研究、算法测试和需要高质量随机数据的应用。
创建时间:
2025-08-02
原始信息汇总

高质量1GiB熵块数据集概述

数据集简介

  • 包含1GB(1,073,741,824字节)高质量熵块,由Eormen Edge-of-Chaos引擎生成
  • 通过三项独立验证套件的严格统计测试
  • 适用于密码学研究、算法测试及需要高质量随机数据的应用

技术规格

  • 熵数据大小:1,073,741,824字节(1 GiB)
  • 总文件大小:1,073,741,888字节(含64字节元数据)
  • 生成方法:两阶段架构(Eormen Edge-of-Chaos引擎 + NIST SP 800-90A兼容HMAC-DRBG白化)
  • 文件格式:二进制(.bin)带结构化元数据
  • 块标识符:f43e3358e35873484045449ac43abdae(唯一随机数)

验证结果

NIST SP800-22 Rev. 1a

  • 执行测试:15/15
  • 通过测试:15/15(100%)
  • 显著性水平:0.01(99%置信度)
  • 总体结果:通过

Dieharder学术测试套件

  • 执行测试:17项(14种测试类型)
  • 通过测试:17/17(100%)
  • 测试选择:系统包含所有适合1GiB文件的"Good"评级测试
  • 总体结果:通过

Eormen内部验证套件

  • 香农熵:7.999999813 bits/byte(接近完美)
  • 最大相关性:7.249×10⁻⁵(可忽略)
  • 块唯一性:完美(1000/1000分)
  • 压缩抗性:平均比率1.0016(优秀)

包含内容

  1. EORM-2025-DEMO.bin - 1GiB熵块文件
  2. 完整文档 - 技术规格和使用指南
  3. 验证结果 - 三项测试套件的详细JSON结果
  4. 测试说明 - 所有统计测试的全面解释

关键统计特性

  • 频率分布:卡方p值=0.148(确认均匀分布)
  • 位平衡:49.999872% 1,50.000128% 0
  • 自相关:最大绝对相关=7.249×10⁻⁵
  • 频谱平坦度:0.974(优秀白度)
  • 矩阵秩:符合随机二进制矩阵理论预期

密码学哈希验证

三级SHA-256验证系统:

  • 仅数据哈希:303ffe6b32535402759eed2fd26bf0f2fd73886a702175db21feb1c07229fbef
  • 完整文件哈希:d79333dd6f84d38c92daf871d87b1d98a9bb84f682f5c664025fb920c369dd2f
  • 元数据哈希:315e8aee12763f6e91cc488141dc88bf63d2d30ff2da4b276345b69539d997aa

文件结构

总大小:1,073,741,888字节 ├── 熵数据:1,073,741,824字节(位置0-1073741823) └── 元数据:64字节(位置1073741824-1073741887) ├── 随机数:16字节(唯一标识符) ├── 时间戳:8字节(生成时间) ├── 文件名:32字节(原始名称) └── 文件大小:8字节(总大小)

科学严谨性

  • 透明度:完整方法披露
  • 独立性:三项独立验证套件
  • 全面性:分析1GiB块的每个字节
  • 标准合规:符合国际密码学测试标准

许可证与用途

  • 许可证:cc-by-4.0
  • 用途:研究、教育和非商业用途

技术说明

  • 生成时间:2025年7月19日21:07:13 UTC
  • 生成过程未使用外部熵源
  • 所有统计测试均在完整1GiB数据集上执行
  • 结果可通过原始生成参数确定性重现
搜集汇总
数据集介绍
main_image_url
构建方式
在密码学随机性研究领域,高质量熵数据集的构建需遵循严格标准。本数据集采用双阶段生成架构,首先通过专有的Eormen边缘混沌引擎产生初始随机序列,再经由符合NIST SP 800-90A标准的HMAC-DRBG后处理进行白化优化,最终形成1GiB的熵数据块。生成过程注重透明性与可复现性,所有参数均完整记录于元数据段,确保科学研究的严谨性。
特点
该数据集的核心特征体现在其卓越的统计属性与全面验证体系。1,073,741,824字节的熵数据呈现近乎完美的比特平衡(49.999872%与50.000128%),同时通过三大权威测试套件验证:NIST SP800-22全部15项测试、Dieharder学术测试套件17项测试以及内部验证套件均获得100%通过率。数据光谱平坦度达0.974,自相关系数低至7.249×10⁻⁵,具备密码学应用所需的理想随机特性。
使用方法
研究人员可通过二进制文件直接访问熵数据块,其中前1,073,741,824字节为核心随机数据,末端64字节为包含时间戳、非ce值等信息的元数据段。使用前建议通过SHA-256三重哈希验证数据完整性,具体哈希值详见技术文档。该数据集适用于密码算法测试、蒙特卡洛模拟及随机性检测基准评估,建议在研究成果中引用原始生成参数以保证实验可复现性。
背景与挑战
背景概述
在密码学与信息安全领域,高质量随机数的生成与验证一直是核心研究议题。该数据集由Eormen研究机构于2025年创建,基于边缘混沌理论引擎构建,旨在提供经过严格统计检验的1GiB熵数据块。其采用两阶段架构,结合NIST SP 800-90A兼容的HMAC-DRBG白化处理,并通过三项独立测试套件验证,为密码算法测试、随机性评估及科学计算提供了可靠的数据基础,推动了熵质量标准化研究的发展。
当前挑战
该数据集致力于解决密码学中随机数质量验证的挑战,包括统计偏差检测、相关性消除及抗压缩性保障等核心问题。构建过程中需克服大规模数据生成的一致性保持、多标准测试套件的适配性,以及元数据与熵数据的无缝集成等技术难点,确保每字节均符合国际密码学标准要求。
常用场景
经典使用场景
在密码学研究中,该数据集作为高质量随机数基准被广泛用于验证伪随机数生成算法的统计特性。研究人员通过分析其通过NIST SP800-22和Dieharder测试套件的完整数据,能够精确评估新开发算法的随机性质量,确保其符合国际密码学标准要求。
解决学术问题
该数据集有效解决了密码学领域对可验证真随机数源的需求问题,为随机性测试方法学研究提供了标准参照系。其通过三重独立验证体系证实了边缘混沌理论在随机数生成中的可行性,推动了确定性随机数生成理论的完善与发展。
衍生相关工作
基于该数据集衍生了多项重要研究,包括《边缘混沌熵在后量子密码中的应用》等开创性论文。这些工作进一步开发了基于混沌理论的轻量级随机数生成器,为物联网安全设备提供了符合NIST标准的随机数解决方案。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作