FROM ATOMIC TO COMPOSITE

github2025-12-15 更新2025-12-17 收录

下载链接：

https://github.com/sitaocheng/from_atomic_to_composite

下载链接

链接失效反馈

官方服务：

资源简介：

开源了用于参数化、上下文和互补推理的训练和测试数据。测试数据根据三个泛化难度级别（即I.I.D.、组合、零样本泛化）进行分割。训练数据足以实现优秀的I.I.D.性能。

We open-source the training and test datasets for parametric, contextual, and complementary reasoning. The test dataset is split into three generalization difficulty levels, namely I.I.D., compositional, and zero-shot generalization. The training dataset is sufficient to achieve excellent I.I.D. performance.

创建时间：

2025-12-01

原始信息汇总

数据集概述

数据集名称

From Atomic to Composite

数据集来源

该数据集为论文《From Atomic to Composite: Reinforcement Learning Enables Generalization in Complementary Reasoning》的代码与数据部分。

数据集内容

数据集包含用于生成合成人类传记（个人资料）的代码，以及用于参数化推理、上下文推理和互补推理的训练与测试数据。

数据划分

测试数据根据泛化难度划分为三个级别：

I.I.D.
组合（Composition）
零样本泛化（Zero-shot Generalization）

训练数据足以实现优秀的I.I.D.性能。

主要文件描述

build_training_and_testing_data.py: 根据三个泛化难度级别构建训练和测试数据集。
data_split_by_portion.py: 将数据集分割为用于监督微调（SFT）和强化学习（RL）的不同比例子集。
datagen_profile.py: 用于生成具有丰富属性和关系的合成人类传记（个人资料）的主脚本。
relations.py: 定义关系模板和逻辑，用于生成各种关系组合。
reshape_q_template.py: 处理和重塑问题模板，为每个关系组合创建最终的问题-答案对。

引用信息

如需使用，请引用以下论文： bibtex @article{cheng2025atomic, title={From Atomic to Composite: Reinforcement Learning Enables Generalization in Complementary Reasoning}, author={Cheng, Sitao and Yin, Xunjian and Zhou, Ruiwen and Li, Yuxuan and Wang, Xinyi and Pan, Liangming and Wang, William Yang and Zhong, Victor}, journal={arXiv preprint arXiv:2512.01970}, year={2025} }

搜集汇总

数据集介绍

构建方式

在知识推理领域，数据集的构建往往依赖于结构化知识的系统化整合。该数据集通过生成合成人类传记的方式构建，利用知识图谱技术将丰富的属性与关系进行逻辑关联。具体而言，脚本首先定义关系模板与组合逻辑，随后生成包含多样化关系组合的虚拟人物档案。在此基础上，通过处理与重塑问题模板，最终形成针对不同关系组合的问题-答案对，并依据泛化难度划分为训练集与测试集，确保了数据在结构上的严谨性与层次性。

使用方法

在应用层面，该数据集主要用于训练与评估模型在互补推理任务上的表现。研究人员可利用其提供的训练数据对模型进行监督微调，随后通过不同难度层级的测试集系统评估模型的泛化能力。数据集已按比例划分为不同子集，便于适配监督学习与强化学习等不同训练范式。通过调用配套的代码脚本，用户能够复现数据生成过程，并灵活调整问题模板与关系组合，以拓展至更广泛的知识推理研究。

背景与挑战

背景概述

在人工智能领域，特别是自然语言处理与推理任务中，构建能够评估模型泛化能力的数据集至关重要。'FROM ATOMIC TO COMPOSITE'数据集于2025年由Cheng等研究人员提出，其核心研究问题聚焦于互补推理的泛化能力。该数据集通过合成人类传记与知识图谱，旨在探索模型从原子级推理到复合推理的过渡，推动强化学习在复杂逻辑推理中的应用。这一工作不仅为评估模型的组合泛化与零样本泛化提供了基准，还对推进人工智能在上下文理解与推理任务中的发展产生了显著影响。

当前挑战

该数据集致力于解决互补推理领域的核心挑战，即模型在面临新颖组合关系时的泛化能力。具体而言，挑战包括如何设计数据以区分I.I.D.、组合与零样本泛化三种难度级别，确保测试集能有效衡量模型超越训练分布的推理性能。在构建过程中，挑战涉及生成具有丰富属性和关系的合成人类传记，同时维护知识图谱的逻辑一致性，以及平衡训练数据的充分性与测试数据的多样性，以避免过拟合并促进真正的泛化学习。

常用场景

经典使用场景

在人工智能与自然语言处理领域，该数据集为研究互补推理的泛化能力提供了结构化基准。其核心应用场景在于训练和评估模型从原子事实中组合出复合推理的能力，例如基于知识图谱中分散的人物属性与关系，系统性地生成连贯的人类传记描述。通过精心设计的训练与测试划分，研究者能够深入探索模型在独立同分布、组合泛化及零样本泛化等不同难度层级上的表现，从而推动推理系统从记忆性学习向逻辑组合的演进。

解决学术问题

该数据集主要致力于解决人工智能中互补推理的泛化难题，即模型如何超越简单的模式匹配，实现从已知原子事实到未知复合场景的逻辑迁移。它通过提供层次化的测试数据，区分了独立同分布、组合与零样本泛化三种难度，使研究者能够定量评估模型在结构化知识上的推理鲁棒性。这一工作填补了传统基准在评估组合泛化能力方面的空白，为理解与提升神经模型的系统性推理能力提供了关键实验基础。

实际应用

在实际应用中，该数据集支撑的互补推理技术可广泛应用于智能问答、个性化内容生成与知识图谱补全等场景。例如，在自动化传记撰写或个性化推荐系统中，模型能够依据分散的人物属性（如职业、爱好、社会关系）动态合成连贯的叙述文本，提升信息服务的准确性与丰富度。此外，其在教育辅助与决策支持系统中亦具潜力，能够帮助用户从碎片化知识中整合出深层见解，推动知识驱动型应用的智能化发展。

数据集最近研究