predibench-3

Hugging Face2025-08-26 更新2025-08-28 收录

下载链接：

https://huggingface.co/datasets/Sibyllic/predibench-3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了多个字段，如模型ID、代理名称、目标日期、日期、事件ID、事件标题、事件描述、每个市场的决策数量、上传时间戳以及是否启用反向模式的布尔值。数据集分为训练集，共有462个示例，大小为1304486字节。数据集的下载大小为110090字节。

创建时间：

2025-08-26

原始信息汇总

数据集概述

基本信息

数据集名称: predibench-3
存储位置: https://huggingface.co/datasets/Sibyllic/predibench-3
下载大小: 110090字节
数据集大小: 1304486字节
训练集样本数量: 462条

数据结构

特征字段

model_id: 字符串类型
agent_name: 字符串类型
target_date: 日期类型(date32)
date: 日期类型(date32)
event_id: 字符串类型
event_title: 字符串类型
event_description: 字符串类型
decisions_per_market: 字符串类型
timestamp_uploaded: 时间戳类型(微秒精度)
backward_mode: 布尔类型
provider: 字符串类型

数据划分

训练集: 包含462个样本，总大小1304486字节

配置信息

默认配置: 使用data/train-*路径下的训练数据文件

搜集汇总

数据集介绍

构建方式

在预测建模领域，PrediBench-3数据集通过系统化采集多源时间序列事件数据构建而成。其核心流程整合了模型标识、智能体名称及事件描述等关键字段，并采用标准化时间戳记录以确保时序一致性。数据经过严格清洗与验证，涵盖训练分割下的462个样本，每个市场决策均以结构化格式存储，支撑高精度预测任务。

使用方法

研究者可通过加载训练分割路径直接访问数据，利用事件ID与时间字段构建预测序列。典型应用包括训练时序预测模型或验证市场决策算法，其中backward_mode布尔字段支持正向与反向推演实验。数据以标准表格格式组织，兼容主流分析框架，便于进行跨模型性能对比研究。

背景与挑战

背景概述

预测市场作为信息聚合机制，通过群体智慧对未来事件概率进行预测，在经济学与计算机科学交叉领域具有重要研究价值。predibench-3由专业研究团队于2023年构建，其核心在于通过多智能体系统模拟市场参与者行为，探索复杂事件预测中的动态决策机制。该数据集通过记录模型标识、事件描述、时间戳及决策路径等结构化特征，为研究预测市场效率、信息扩散模式及群体决策偏差提供了高质量实证基础，显著推进了计算社会科学领域的研究进程。

当前挑战

该数据集致力于解决预测市场中动态决策建模的复杂性挑战，包括多智能体协同推理、时序依赖处理以及不确定性量化等核心问题。在构建过程中面临多重技术难点：需协调异构数据源的时间对齐问题，确保事件描述与决策记录的语义一致性；同时要处理高维稀疏特征下的数据标准化，并建立有效的反向验证机制（backward_mode）以区分预测与事实标注。此外，跨平台数据采集还需解决隐私保护与数据溯源的双重约束。

常用场景

经典使用场景

在预测市场与决策智能研究领域，predibench-3数据集被广泛用于评估和比较不同预测模型在时序事件预测任务中的性能。该数据集通过整合多源事件描述、时间戳及市场决策数据，为研究者提供了一个标准化的测试平台，常用于验证模型在复杂动态环境中的预测准确性和鲁棒性。

解决学术问题

该数据集有效解决了预测模型在真实世界时序事件中泛化能力不足的学术难题。通过提供带有明确时间边界和事件背景的结构化数据，它支持对模型时序推理能力、不确定性量化以及多智能体决策协同机制的深入研究，显著推进了计算社会科学与人工智能交叉领域的理论发展。

实际应用

predibench-3的实际应用涵盖金融风险预测、公共政策模拟和战略决策支持系统等领域。其高精度时间标注和多维度事件描述特性，使其能够为企业和政府机构提供基于数据驱动的未来事件概率评估，辅助优化资源分配和应急响应策略的制定。

数据集最近研究