OpenScienceReasoning-2
收藏Hugging Face2025-07-31 更新2025-08-01 收录
下载链接:
https://huggingface.co/datasets/nvidia/OpenScienceReasoning-2
下载链接
链接失效反馈官方服务:
资源简介:
OpenScienceReasoning-2是一个旨在提高大型语言模型通用推理能力的多领域合成数据集。它包含了跨越STEM、法律、经济学和人文科学等多个科学领域的问题答案对,既有选择题也有开放性问题,并提供了详细的推理痕迹。这个数据集可用于商业用途,并通过监督微调或强化学习来提升在高级基准测试上的准确性。
提供机构:
NVIDIA
创建时间:
2025-07-29
原始信息汇总
OpenScienceReasoning-2 数据集概述
数据集描述
OpenScienceReasoning-2 是一个多领域合成数据集,旨在提升大型语言模型(LLMs)的通用推理能力。该数据集包含多项选择和开放式问答对,涵盖科学、技术、工程、数学(STEM)、法律、经济学和人文等多个领域。数据集通过监督微调或强化学习来提高模型在高级基准测试(如GPQA-Diamond、MMLU-Pro和HLE)上的准确性。
数据集所有者
NVIDIA Corporation
数据集创建日期
2025年6月20日
许可证/使用条款
本数据集采用知识共享署名4.0国际许可协议(CC BY 4.0)许可。
预期用途
OpenScienceReasoning-2 旨在供社区使用,以继续改进开放模型。数据可自由用于训练和评估。
数据版本
- v2
数据集特征
数据收集方法
- 合成
标注方法
- 合成
数据集格式
文本
数据集量化
- 记录数量:160万问答对
- 总数据存储:35GB
伦理考虑
NVIDIA认为可信赖的人工智能是共同责任,并已制定政策和实践以支持广泛的人工智能应用开发。开发者在下载或使用本数据集时,应确保其符合相关行业和使用案例的要求,并解决潜在的产品误用问题。
如需报告安全问题或NVIDIA AI相关疑虑,请访问NVIDIA安全漏洞提交页面。
搜集汇总
数据集介绍

构建方式
在人工智能领域,高质量的数据集对于提升大语言模型的推理能力至关重要。OpenScienceReasoning-2作为多领域合成数据集,通过DeepSeek-R1-0528模型生成全新的问题与答案对,覆盖STEM、法律、经济学及人文科学等广泛学科。该数据集采用严格的合成方法构建,包含160万条问答对,总计35GB存储容量,确保了数据的一致性与质量提升,为后续模型训练提供了坚实基础。
特点
OpenScienceReasoning-2以其跨学科的广度和深度脱颖而出,不仅包含多项选择题和开放式问题,还提供详细的推理过程。数据集特别针对GPQA-Diamond、MMLU-Pro和HLE等高级基准测试优化,旨在通过监督微调或强化学习显著提升模型性能。其合成数据的特性使得内容具有高度可控性,同时避免了真实数据可能带来的隐私和伦理问题。
使用方法
该数据集专为社区改进开放模型而设计,用户可自由用于训练和评估。通过Creative Commons Attribution 4.0国际许可协议授权,支持商业用途。研究人员可直接将其应用于大语言模型的监督微调,或作为强化学习的反馈信号。使用前建议开发者结合内部模型团队评估特定行业和应用场景的需求,以确保模型的安全性和适用性。
背景与挑战
背景概述
OpenScienceReasoning-2是由NVIDIA Corporation于2025年6月20日发布的多领域合成数据集,旨在提升大型语言模型(LLMs)的通用推理能力。该数据集覆盖STEM、法律、经济学及人文科学等多个学科领域,包含160万对多选题和开放式问答对,并附有详细的推理过程。作为OpenScience数据集的升级版本,OpenScienceReasoning-2通过采用DeepSeek-R1-0528模型生成新问题并优化解答一致性,显著提升了数据质量。该数据集以促进开放模型发展为宗旨,支持监督微调和强化学习,对推动GPQA-Diamond、MMLU-Pro等高级基准测试的性能突破具有重要价值。
当前挑战
OpenScienceReasoning-2面临的挑战主要集中在领域问题与构建过程两方面。在领域层面,如何确保生成的问题能全面涵盖多学科知识并保持高难度,以有效提升模型在复杂推理任务中的表现,仍是一个关键难题。构建过程中,合成数据的真实性、多样性与逻辑一致性对数据质量至关重要,但依赖模型生成内容可能导致隐性偏见或错误累积。此外,跨学科知识的准确整合与大规模数据的管理优化,也是该数据集持续迭代中需要解决的技术瓶颈。
常用场景
经典使用场景
在人工智能领域,OpenScienceReasoning-2数据集被广泛应用于提升大型语言模型(LLMs)的推理能力。通过其跨学科的多选题和开放式问答对,研究人员能够针对模型在STEM、法律、经济学及人文学科等领域的表现进行系统性评估与优化。该数据集尤其适用于监督微调和强化学习场景,为模型在复杂推理任务中的表现提供了坚实的训练基础。
实际应用
该数据集的实际价值体现在商业和科研场景中。企业可利用其训练更精准的行业专用模型,如法律咨询或经济预测系统;教育机构则能开发智能辅导工具,帮助学生掌握跨学科知识。其开放许可特性进一步降低了AI技术的应用门槛,推动了产业智能化进程。
衍生相关工作
围绕OpenScienceReasoning-2已产生多项重要研究,包括基于DeepSeek-R1-0528架构的增强型推理模型开发,以及跨模态知识迁移方法的创新。这些工作不仅验证了数据集的质量,更拓展了其在多任务学习、少样本推理等前沿方向的应用潜力,持续推动着开放模型社区的发展。
以上内容由遇见数据集搜集并总结生成



