orca-math-word-reflection
收藏Orca-Math Word Problems with Reflection 数据集概述
数据集摘要
Orca-Math Word Problems with Reflection 数据集是原始 ORCA Math Word Problems 200k 数据集 的一个子集扩展。该版本引入了一种 “思考与反思” 格式,旨在通过鼓励在生成解决方案之前进行逐步思考来增强问题解决方法。
在该数据集中,每个数学文字问题及其对应的解决方案被转换为一种结构化的反思格式。这种过程鼓励在生成最终输出之前进行更深思熟虑的推理。
数据集创建
源数据
- 原始数据集: Microsoft/ORCA-Math-Word-Problems-200k
- 来源: 数据集包含旨在提高数学解决模型性能的文字问题。原始数据集包含文字问题及其解决方案。
转换过程
- 思考与反思格式: 每个数学文字问题被处理为以下结构:
- <thinking>: 反映解决文字问题所需的方法。
- <reflection>: 重新评估或确认解决方案的正确性。
- <output>: 文字问题的最终解决方案。
数据集结构
数据字段
- question (string): 原始数学文字问题。
- solution (string): 数学文字问题的原始解决方案。
- Reflection (string): 将文字问题和解决方案转换为思考与反思格式。这包括多个推理和反思步骤,随后是最终解决方案。
示例
json { "question": "如果一辆车在2小时内行驶60英里,车的速度是多少?", "solution": "车的速度是每小时30英里。", "Reflection": "<thinking> 车在2小时内行驶60英里。我们可以通过将距离除以时间来计算速度。 </thinking><reflection> 将60除以2得到每小时30英里。车的速度是30英里每小时。 </reflection><output> 30英里每小时 </output>" }
数据集使用
该数据集适用于需要更好地理解人类在回答问题之前的反思思维的模型训练。它鼓励结构化推理,这可能会在复杂问题解决任务中带来更好的性能,特别是在基于教育的AI系统中。
潜在应用:
- 数学辅导: 通过教授学生在提供最终答案之前分解和反思他们的方法,增强AI驱动的辅导系统。
- AI研究: 训练和微调能够更好地模仿人类推理和结构化问题解决的模型。
- 认知科学: 分析当AI模型被迫遵循思考-反思-输出模式时的响应方式。
数据集统计
- 条目数量: 1313
许可
该数据集遵循原始 ORCA Math Word Problems 200k 数据集 的许可条款,并附加了与转换内容相关的许可。
引用
如果您使用此数据集,请按如下方式引用原始数据集创建者和处理反思的作者:
@inproceedings{orca-math-reflection, author = {Harsh Kumar}, title = {Orca-Math Word Problems with Reflection}, year = {2024}, url = {https://huggingface.co/datasets/Harshkmr/orca-math-word-reflection} }




