Ego-R1-Data
收藏Ego-R1 数据集概述
数据集简介
Ego-R1 Data 是一个综合性数据集,旨在促进大型语言模型在工具增强推理和强化学习方面的训练。该数据集用于 Ego-R1 Codebase。
数据集组成
- Ego-CoTT-25K: 25,000 条工具链思维示例,用于监督微调 (SFT)
- Ego-QA-4.4K: 4,400 条问答对,用于强化学习 (RL) 训练
数据集结构
data/ ├── Ego-CoTT-25K/ # 25K 工具链思维数据 (SFT) │ └── train-cott.json # 主训练数据 (415MB) │ ├── Ego-QA-4.4K/ # 4.4K QA 对 (RL 训练) │ ├── gemini-1.5K/ # 1.5K Gemini 生成的 QA 对 │ │ ├── A1.json # 代理 A1 数据 │ │ ├── A2.json # 代理 A2 数据 │ │ ├── A3.json # 代理 A3 数据 │ │ ├── A4.json # 代理 A4 数据 │ │ ├── A5.json # 代理 A5 数据 │ │ └── A6.json # 代理 A6 数据 │ │ │ └── manual-2.9K/ # 2.9K 手动创建的 QA 对 │ ├── A1_JAKE.json # Jake 的手动标注 │ ├── A2_ALICE.json # Alice 的手动标注 │ ├── A3_TASHA.json # Tasha 的手动标注 │ ├── A4_LUCIA.json # Lucia 的手动标注 │ ├── A5_KATRINA.json # Katrina 的手动标注 │ └── A6_SHURE.json # Shure 的手动标注 │ ├── Ego-CoTT-raw/ # 原始数据和附加格式 │ ├── A1/, A2/, A3/, A4/, A5/, A6/ # 各代理目录 │ ├── train_sft.json # SFT 训练数据 (415MB) │ ├── train_rl.parquet # RL 训练数据 (19MB) │ ├── test.json # JSON 格式测试数据 │ └── test.parquet # Parquet 格式测试数据
使用方式
监督微调 (SFT)
数据已处理为符合 LLaMA-Factory 格式的多轮对话格式。使用方法: bash mkdir LLaMA-Factory/data scp data/Ego-CoTT-25K/train-cott.json LLaMA-Factory/data/
强化学习 (RL)
数据已处理为符合 verl 格式的基于规则的奖励格式。使用方法: bash mkdir Ego-R1-Agent/data scp data/Ego-CoTT-raw/*.parquet Ego-R1-Agent/data/
数据格式
两个数据集均经过后处理,采用优化后的结构化格式,适用于具有工具增强推理能力的大型语言模型训练。后处理代码可在 GitHub Repo 找到。
数据处理
Ego-CoTT-raw/ 中的原始数据包含未经处理的文件和用于 RL 训练的替代格式 (Parquet)。




