synthetic_corrections

Hugging Face2025-09-01 更新2025-09-02 收录

下载链接：

https://huggingface.co/datasets/linagora/synthetic_corrections

下载链接

链接失效反馈

官方服务：

资源简介：

合成修正数据集包含300个建筑师与建造者之间的对话样本，每个样本包含三个建筑师指示，建造者需要根据指示在网格上构建简单形状。建造者正确构建了其中的两个形状，第三个形状构建错误，建筑师会给出修正指示。数据集的目标是训练模型预测建造者响应修正指示所需的一系列动作（放置或移除方块）。每个样本还包含了对话轮之间的语义关系。

创建时间：

2025-08-21

原始信息汇总

Synthetic Corrections Data 数据集概述

数据集基本信息

许可证类型: CC0-1.0
数据规模: 300个对话样本

数据内容与结构

对话场景: 建筑师（Architect）与建造者（Builder）之间的交互对话
对话模式: 每个对话样本包含三个建筑师指令
任务设计: 建造者正确构建其中两个形状，第三个指令包含对错误构建的纠正
数据字段:
- 对话内容
- 结构字段（Structure）：对话轮次间的语义关系，以类型化元组表示

任务目标

代理模型任务: 扮演建造者角色，预测响应建筑师纠正的动作序列（放置或移除方块）

数据生成方法

生成脚本: /generation/builder_mistakes.py（生成易于阅读的文本格式对话）
格式化脚本: /generation/format_nebulipa.py（将文本文件重新格式化为可用于代理测试的CSV文件）

数据来源

灵感来源: 基于Minecraft结构化对话语料库中的交互模式

搜集汇总

数据集介绍

构建方式

在对话系统研究领域，synthetic_corrections数据集通过模拟建筑师与建造者之间的交互情景构建而成。该数据集包含300组人工生成的对话，灵感来源于Minecraft结构化对话语料库中的互动模式。生成过程中，首先运行builder_mistakes.py脚本创建包含建造错误的对话文本，随后通过format_nebulipa.py将文本转换为适用于智能体测试的标准化CSV格式，确保数据具有一致的对话结构和纠错标签。

特点

该数据集的显著特征体现在其精心设计的纠错对话结构上。每个对话样本包含三轮建筑师指令，其中建造者会正确执行两轮指令而在第三轮出现错误，最终通过建筑师的纠正回合完成交互闭环。除了自然语言对话内容，数据集还额外提供了对话轮次间的语义关系标注，以类型化元组形式存储在Structure字段中，为研究对话逻辑结构提供了多维度注释信息。

使用方法

在使用该数据集时，研究者主要将其用于训练和评估对话智能体的纠错响应能力。模型需要扮演建造者角色，根据建筑师最后的纠正指令预测正确的方块放置或移除动作序列。数据集提供的结构化语义关系标注可进一步用于提升模型对对话逻辑的理解，通过解析类型化元组实现更精准的对话状态跟踪和动作生成。

背景与挑战

背景概述

对话系统研究领域长期关注智能体在协作任务中的交互能力，synthetic_corrections数据集由LinaGora研究团队于2023年构建，其核心研究目标在于探索建筑指令修正场景下的对话理解与动作生成机制。该数据集通过模拟《我的世界》建筑协作场景，构建了包含300组人机对话的语料库，每轮对话包含建筑师指令、建造者执行反馈及修正指令三重交互结构，为研究指令理解、错误修正与动作序列预测提供了重要实验基础。

当前挑战

该数据集旨在解决协作建造任务中指令修正与动作生成的复合挑战，包括多轮对话语义连贯性维护、错误动作识别与修正指令的映射、以及三维空间动作序列的精确生成。数据构建过程中面临合成数据真实性与多样性的平衡挑战，需通过规则系统模拟人类建造错误模式，同时确保动作序列的物理可行性与语义一致性，此外还需构建结构化标注体系以捕捉对话行为与语义关系的复杂映射。

常用场景

经典使用场景

在对话系统与指令理解研究中，synthetic_corrections数据集为多轮交互修正任务提供了标准测试平台。其经典应用场景集中于构建智能体对错误指令的识别与响应机制，通过模拟建筑师与建造者之间的三维空间对话，要求模型根据修正性指令预测正确的方块操作序列。该场景有效验证了智能体在持续对话中维护状态跟踪和执行增量修正的能力。

衍生相关工作

该数据集衍生出多项对话建模与指令执行的经典研究，包括基于结构感知的对话状态跟踪模型、多轮修正指令的序列预测算法，以及结合语义关系的交互式决策系统。部分研究进一步扩展了数据生成框架，开发出支持更多错误类型与复杂空间关系的合成对话数据集，推动了任务型对话系统的精细化发展。

数据集最近研究