five

mkzheng/MegaScience

收藏
Hugging Face2025-09-19 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/mkzheng/MegaScience
下载链接
链接失效反馈
官方服务:
资源简介:
MegaScience是一个包含125万条高质量实例的大型开源数据集混合体,用于科学推理任务。该数据集从多个公开数据集中精选并综合了高质量子集,对所有数据集(除了TextbookReasoning)进行了逐步解答的标注,以提升模型在科学推理方面的性能。

MegaScience is a large-scale mixture of high-quality open-source datasets consisting of 1.25 million instances, designed for science reasoning tasks. The dataset is curated from multiple public datasets, integrating high-quality subsets and annotated step-by-step solutions for all datasets except TextbookReasoning, to enhance model performance in scientific reasoning.
提供机构:
mkzheng
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作