SBI-benchmarks

Hugging Face2025-10-29 更新2025-10-30 收录

下载链接：

https://huggingface.co/datasets/aurelio-amerio/SBI-benchmarks

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个配置，每个配置都有不同的特征、数据划分和文件路径。特征主要包含不同维度和类型的浮点数。数据划分包括训练集、验证集和测试集，并提供了各自的大小（字节）和示例数量。数据集涵盖了伯努利广义线性模型、高斯线性模型、高斯混合模型、引力波等多种类型的数据。每个配置还包含了下载大小和整个数据集的总大小信息。

创建时间：

2025-10-17

原始信息汇总

SBI-benchmarks 数据集概述

数据集基本信息

数据集地址：https://huggingface.co/datasets/aurelio-amerio/SBI-benchmarks
配置数量：13个独立配置
总下载大小：约63.2 GB
总数据集大小：约14.6 GB

配置详情

1. Bernoulli GLM 系列

bernoulli_glm

特征：xs (float32列表), thetas (float32列表)
数据划分：
- 训练集：1,000,000样本，88 MB
- 验证集：1,000样本，88 KB
下载大小：81.4 MB
数据集大小：88.1 MB

bernoulli_glm_posterior

特征：reference_samples (float32列表的列表), observations (float32列表的列表), true_parameters (float32列表的列表)
数据划分：
- 参考后验：10样本，4.4 MB
下载大小：4.7 MB
数据集大小：4.4 MB

bernoulli_glm_raw

特征：xs (float32列表), thetas (float32列表)
数据划分：
- 训练集：1,000,000样本，448 MB
- 验证集：1,000样本，448 KB
下载大小：57.6 MB
数据集大小：448.4 MB

bernoulli_glm_raw_posterior

特征：reference_samples (float32列表的列表), observations (float32列表的列表), true_parameters (float32列表的列表)
数据划分：
- 参考后验：10样本，4.4 MB
下载大小：4.7 MB
数据集大小：4.4 MB

2. Gaussian Linear 系列

gaussian_linear

特征：xs (float32列表), thetas (float32列表)
数据划分：
- 训练集：1,000,000样本，88 MB
- 验证集：1,000样本，88 KB
下载大小：81.5 MB
数据集大小：88.1 MB

gaussian_linear_posterior

特征：reference_samples (float32列表的列表), observations (float32列表的列表), true_parameters (float32列表的列表)
数据划分：
- 参考后验：10样本，4.4 MB
下载大小：4.7 MB
数据集大小：4.4 MB

3. Gaussian Mixture 系列

gaussian_mixture

特征：xs (float32列表), thetas (float32列表)
数据划分：
- 训练集：1,000,000样本，24 MB
- 验证集：1,000样本，24 KB
下载大小：17.2 MB
数据集大小：24 MB

gaussian_mixture_posterior

特征：reference_samples (float32列表的列表), observations (float32列表的列表), true_parameters (float32列表的列表)
数据划分：
- 参考后验：10样本，1.2 MB
下载大小：1.3 MB
数据集大小：1.2 MB

4. Gravitational Waves

gravitational_waves

特征：
- xs (8192×2 float32数组)
- thetas (float32列表)
数据划分：
- 训练集：89,488样本，8.8 GB
- 验证集：512样本，50.3 MB
- 测试集：10,000样本，983.2 MB
下载大小：6.6 GB
数据集大小：9.8 GB

5. SLCP 系列

slcp

特征：xs (float32列表), thetas (float32列表)
数据划分：
- 训练集：1,000,000样本，24 MB
- 验证集：1,000样本，24 KB
下载大小：17.2 MB
数据集大小：24 MB

slcp_posterior

特征：reference_samples (float32列表的列表), observations (float32列表的列表), true_parameters (float32列表的列表)
数据划分：
- 参考后验：10样本，2.4 MB
下载大小：2.7 MB
数据集大小：2.4 MB

6. Two Moons 系列

two_moons

特征：xs (float32列表), thetas (float32列表)
数据划分：
- 训练集：1,000,000样本，24 MB
- 验证集：1,000样本，24 KB
下载大小：17.2 MB
数据集大小：24 MB

two_moons_posterior

特征：reference_samples (float32列表的列表), observations (float32列表的列表), true_parameters (float32列表的列表)
数据划分：
- 参考后验：10样本，1.2 MB
下载大小：1.3 MB
数据集大小：1.2 MB

搜集汇总

数据集介绍

构建方式

在贝叶斯推断研究领域，SBI-benchmarks数据集通过系统化的仿真流程构建而成。该数据集采用概率编程方法生成合成数据，每个配置均基于特定的统计模型进行参数采样和观测值模拟。以伯努利广义线性模型为例，通过从先验分布中抽取参数向量，并基于这些参数生成对应的观测数据，构建了包含百万训练样本的大规模数据集。数据集严格划分训练、验证和测试集，确保模型评估的可靠性。

使用方法

研究人员可通过HuggingFace数据集库直接加载SBI-benchmarks，按需选择特定模型配置进行实验。数据集支持标准化的训练-验证-测试流程，用户可调用相应配置的拆分方法获取数据子集。对于后验推断任务，数据集提供的参考样本可作为算法性能评估的标准。数据字段设计清晰，xs代表观测数据，thetas对应模型参数，便于直接输入各类贝叶斯推断算法进行模型训练和验证。

背景与挑战

背景概述

SBI-benchmarks数据集作为仿真推理领域的重要基准，由研究机构于2020年代初期开发，旨在解决复杂概率模型中的贝叶斯推断问题。该数据集通过整合伯努利广义线性模型、高斯混合模型及引力波分析等多个仿真场景，为评估近似贝叶斯计算方法提供了标准化测试平台。其核心研究目标在于推动仿真推理算法在高维参数空间与复杂似然函数中的可扩展性，对计算统计学与机器学习交叉领域的发展产生了深远影响。

当前挑战

该数据集针对仿真推理中似然函数不可解析的核心难题，需解决高维后验分布近似与计算效率间的平衡挑战。构建过程中面临多模态分布建模的数值稳定性问题，例如引力波配置中8192维时间序列数据的存储与采样复杂度。同时，参考后验样本的生成需要克服随机过程收敛性验证与跨配置一致性的技术瓶颈。

常用场景

经典使用场景

在贝叶斯推断研究领域，SBI-benchmarks数据集为模拟推断算法提供了标准化的评估框架。该数据集通过伯努利广义线性模型、高斯混合模型等多个概率模型配置，生成了包含参数先验分布与观测数据的配对样本。研究人员可基于这些结构化数据，系统性地验证各类近似贝叶斯计算方法的性能表现，特别是在高维参数空间中的推断精度与计算效率。

解决学术问题

该数据集有效解决了贝叶斯推断中似然函数难以计算的核心难题。通过提供精确的后验分布参考样本，研究者能够客观评估神经网络密度估计、归一化流等现代推断技术的准确性。特别是在引力波信号分析等复杂物理模型中，数据集为标准化的算法比较建立了可靠基准，显著推进了可扩展贝叶斯计算方法的发展进程。

实际应用

在工程实践层面，该数据集支撑着多个领域的概率建模应用。引力波探测模块利用其时间序列数据训练神经网络，实现天体物理参数的快速反演；医疗诊断系统通过伯努利广义线性模型优化疾病预测的置信度校准；工业质量控制则借助高斯混合模型实现生产参数的异常检测。这些应用均受益于数据集提供的标准化概率建模基准。

数据集最近研究