five

YuehHanChen/forecasting

收藏
Hugging Face2024-03-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/YuehHanChen/forecasting
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为研究论文《Approaching Human-Level Forecasting with Language Models》开发的,来源于多个预测平台,包括Metaculus、Good Judgment Open、INFER、Polymarket和Manifold。数据集包含背景描述、解决准则和时间戳等信息。原始数据集包含48,754个问题和7,174,607个用户预测,涵盖了2015年至2024年的全球各种问题和主题。数据经过过滤、调整不平衡、二进制聚焦和时间分割等步骤进行整理,最终得到5,516个二进制问题,用于训练、验证和测试。该数据集对于研究语言模型的预测能力具有重要意义。

该数据集是为研究论文《Approaching Human-Level Forecasting with Language Models》开发的,来源于多个预测平台,包括Metaculus、Good Judgment Open、INFER、Polymarket和Manifold。数据集包含背景描述、解决准则和时间戳等信息。原始数据集包含48,754个问题和7,174,607个用户预测,涵盖了2015年至2024年的全球各种问题和主题。数据经过过滤、调整不平衡、二进制聚焦和时间分割等步骤进行整理,最终得到5,516个二进制问题,用于训练、验证和测试。该数据集对于研究语言模型的预测能力具有重要意义。
提供机构:
YuehHanChen
原始信息汇总

数据集概述

数据来源与格式

  • 来源平台:Metaculus, Good Judgment Open, INFER, Polymarket, Manifold
  • 数据结构
    • 背景描述:每个预测问题的背景信息。
    • 解决标准:每个问题的解决指南。
    • 时间戳:包括发布日期、预测提交截止日期和结果解决日期。

原始数据组成

  • 数据量:包含48,754个问题和7,174,607个用户预测(2015年至2024年)。
  • 问题类型:涵盖多种问题类型和全球话题。
  • 数据挑战:存在定义不明确的问题和2023年6月1日后的平台贡献不平衡问题。

数据筛选过程

  • 过滤:排除定义不明确、过于个人化或小众兴趣的问题。
  • 平衡调整:解决近期来源不平衡问题,确保问题多样性。
  • 二元化:将多选问题转换为二元格式,专注于二元结果分析。
  • 时间隔离:测试集仅包含2024年6月1日之后发布的问题,早期问题用于训练和验证集。

数据集规模

  • 二元问题数量:总计5,516个,其中3,762个用于训练,840个用于验证,914个用于测试。

研究意义

  • 研究目标:评估语言模型在预测能力上与人类水平的对比,旨在超越或达到人类预测性能。
  • 数据集作用:支持对高质量、相关预测问题的集中分析。

引用信息

  • BibTeX: bibtex @misc{halawi2024approaching, title={Approaching Human-Level Forecasting with Language Models}, author={Danny Halawi and Fred Zhang and Chen Yueh-Han and Jacob Steinhardt}, year={2024}, eprint={2402.18563}, archivePrefix={arXiv}, primaryClass={cs.LG} }
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作