MU-NLPC/Calc-asdiv_a
收藏Hugging Face2023-10-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MU-NLPC/Calc-asdiv_a
下载链接
链接失效反馈官方服务:
资源简介:
Calc-asdiv_a数据集是一个专注于算术的简单数学文字问题集合,源自ASDiv数据集的算术子集。该数据集的主要新增内容是`chain`列,它将解决方案转换为易于解析的HTML-like语言。数据包含三种类型的标签:gadget(用于调用外部工具)、output(外部工具的输出)和result(数学问题的最终答案)。该数据集旨在训练能够使用外部工具(如计算器)增强推理能力的模型,并提供了一个测试基准。
提供机构:
MU-NLPC
原始信息汇总
数据集概述
数据集信息
配置名称:default
- 特征:
- id: 字符串
- question: 字符串
- chain: 字符串
- result: 字符串
- result_float: 浮点数
- result_unit: 字符串
- grade: 整数
- source_question: 字符串
- 分割:
- test:
- 字节数: 415636
- 样本数: 1218
- test:
- 下载大小: 152949
- 数据集大小: 415636
配置名称:original-splits
- 特征:
- id: 字符串
- question: 字符串
- chain: 字符串
- result: 字符串
- result_float: 浮点数
- result_unit: 字符串
- grade: 整数
- source_question: 字符串
- 分割:
- test:
- 字节数: 415664
- 样本数: 1218
- test:
- 下载大小: 152949
- 数据集大小: 415664
数据文件配置
配置名称:default
- 数据文件:
- 分割: test
- 路径: data/test-*
配置名称:original-splits
- 数据文件:
- 分割: test
- 路径: original-splits/test-*
数据集摘要
该数据集是一系列专注于算术的简单数学文字问题的集合。它源自ASDiv的算术子集。
该数据集变体的主要新增内容是chain列。它通过将解决方案转换为一种可以轻松解析的简单html-like语言(例如通过BeautifulSoup)来创建。数据包含三种类型的标签:
- gadget: 其内容旨在通过调用外部工具(在这种情况下是基于sympy的计算器)进行评估的标签
- output: 外部工具的输出
- result: 数学问题的最终答案(一个数字)
支持的任务
该数据集变体旨在用于训练能够使用外部工具增强其响应事实性的思维链推理模型。该数据集提供了模型可以在推理链中将计算外包给计算器的情境。
数据分割
该数据集不包含数据分割。我们将整个数据集视为测试基准。
属性
- id: 示例的ID
- question: 问题描述(英文)
- chain: 一系列简单操作(源自expression),导致解决方案
- result: 作为数字或分数(字符串)的x的解决方案
- result_float: 与result相同,但转换为浮点数
- result_unit: 结果的单位
- grade: 估计问题将在其中练习的学校年级
- source_question: 示例的来源
属性id、question、chain和result存在于Calc-X collection中的所有数据集中。



