YuehHanChen/forecasting_raw

Name: YuehHanChen/forecasting_raw
Creator: YuehHanChen
Published: 2024-03-04 17:45:37
License: 暂无描述

Hugging Face2024-03-04 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/YuehHanChen/forecasting_raw

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集来源于多个预测平台，如Metaculus、Good Judgment Open、INFER、Polymarket和Manifold，用户在这些平台上通过为各种结果分配概率来预测未来事件的可能性。数据集包含背景描述、解决标准和时间戳等信息。数据集由50,343个问题和6,534,042个用户预测组成，涵盖33,664个二元问题、9,725个多项选择题、4,019个数值问题和1,346个其他类型的问题，时间跨度为2015年至2024年。该数据集在研究语言模型预测能力方面具有重要意义。

提供机构：

YuehHanChen

原始信息汇总

数据集概述

数据来源和格式

来源平台：Metaculus, Good Judgment Open, INFER, Polymarket, Manifold
数据结构：
- 背景描述：提供预测问题的上下文。
- 解决标准：定义问题何时以及如何解决。
- 时间戳：包括发布日期（开始日期）、预测提交截止日期（关闭日期）和解决日期（解决日期）。

数据集组成

问题数量：50,343个问题，时间跨度从2015年到2024年。
用户预测数量：6,534,042个用户预测。
问题类型：
- 二元问题：33,664个
- 多选问题：9,725个
- 数值问题：4,019个
- 其他类型问题：1,346个

研究意义

该数据集在研究中起着关键作用，使我们能够探索语言模型在预测未来事件中的能力及其达到人类水平性能的潜力。

引用方式

bibtex @misc{halawi2024approaching, title={Approaching Human-Level Forecasting with Language Models}, author={Danny Halawi and Fred Zhang and Chen Yueh-Han and Jacob Steinhardt}, year={2024}, eprint={2402.18563}, archivePrefix={arXiv}, primaryClass={cs.LG} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集