FreedomIntelligence/OVM-process
收藏Hugging Face2024-04-01 更新2024-04-21 收录
下载链接:
https://hf-mirror.com/datasets/FreedomIntelligence/OVM-process
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于训练过程奖励模型的GSM8K数据集,响应由llama2-7b生成,标签由GPT-4标注。`step_labels`表示步骤的逻辑正确性,定义为“逻辑正确且基于准确的前提,不一定有助于解决问题”;`step_labels_progress`表示步骤的有用性,定义为“逻辑正确,基于准确的前提,并有助于解决问题”。
提供机构:
FreedomIntelligence
原始信息汇总
数据集概述
数据集特征
- idx: 整数类型
- input: 字符串类型
- question: 字符串类型
- answer: 字符串类型
- ground_truth: 字符串类型
- outputs: 列表类型,包含以下子特征:
- label: 布尔类型
- response: 字符串类型
- response_answer: 字符串类型
- step_labels: 序列,布尔类型
- step_labels_progress: 序列,布尔类型
数据集分割
- train:
- 数据大小: 242865608 字节
- 示例数量: 7473
数据集大小
- 下载大小: 70988379 字节
- 数据集大小: 242865608 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



