zharry29/CREPE
收藏Hugging Face2023-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zharry29/CREPE
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为CREPE(Causal Reasoning of Entities and Events in Procedural Texts),用于研究程序文本中实体和事件的因果推理。数据集包含6个列:`goal`(目标)、`steps`(步骤)、`event`(事件)、`event_answer`(事件答案)、`entity`(实体)和`entity_answer`(实体答案)。`goal`表示程序的目标,`steps`是程序中的所有步骤列表,`event`是一个事件,其发生的可能性因步骤中的事件而变化,`event_answer`是事件可能性变化的真实答案,`entity`是与事件直接相关的实体,其状态变化会直接影响事件的可能性,`entity_answer`是实体状态变化的真实答案。数据集中还包含一个词汇表,解释了标签的含义,如0表示事件/实体状态发生的可能性较前一步减少,1表示可能性相等,2表示可能性增加。
This dataset is named CREPE (Causal Reasoning of Entities and Events in Procedural Texts), which is designed to study causal reasoning of entities and events within procedural texts. The dataset includes 6 columns: `goal`, `steps`, `event`, `event_answer`, `entity`, and `entity_answer`. `goal` refers to the objective of the procedural task; `steps` is a list of all steps contained in the procedure; `event` denotes an event whose likelihood of occurrence varies with the events in the steps; `event_answer` is the ground-truth answer for the change in the event's likelihood; `entity` refers to the entity directly related to the event, whose state changes will directly impact the event's likelihood; `entity_answer` is the ground-truth answer for the entity's state changes. The dataset also features a vocabulary that clarifies the meanings of the labels: 0 indicates that the likelihood of either the event or the entity's state decreases compared to the previous step, 1 means the likelihood remains unchanged, and 2 signifies that the likelihood increases.
提供机构:
zharry29
原始信息汇总
数据集概述
本数据集名为CREPE,全称为Causal Reasoning of Entities and Events in Procedural Texts。该数据集与论文“Causal Reasoning of Entities and Events in Procedural Texts”相关联,旨在分析程序文本中的实体和事件的因果关系。
数据集文件
data_dev_v2.json: CREPE的开发集。data_test_v2.json: CREPE的测试集。
数据集结构
CREPE数据集包含6个主要字段:
goal: 表示程序的目标。steps: 包含程序中所有步骤的列表。event: 由于步骤中的事件而可能发生变化的事件。event_answer: 事件发生可能性的真实变化。entity: 直接关联到event的实体,其状态变化直接影响event的可能性。entity_answer: 实体状态变化的真实情况。
标签解释
| Label | 含义 |
|---|---|
| 0 | event/entity state 相较于前一步骤发生的可能性降低。 |
| 1 | event/entity state 相较于前一步骤发生的可能性相同。 |
| 2 | event/entity state 相较于前一步骤发生的可能性增加。 |
搜集汇总
数据集介绍

构建方式
在程序性文本理解领域,CREPE数据集聚焦于实体与事件的因果推理。该数据集通过精心设计的标注流程构建,以程序性文本中的目标与步骤序列为基础,针对每个步骤标注特定事件发生的可能性变化及关联实体状态的变化。标注过程严格遵循统一的标注指南,确保每个样本包含目标、步骤列表、事件、事件答案、实体及实体答案六列数据,并通过开发集与测试集的划分支持模型评估与迭代。
特点
CREPE数据集的核心特点在于其专注于程序性文本中的动态因果推理。数据集以事件可能性与实体状态的双重标注为特色,通过0(更不可能)、1(同等可能)、2(更可能)三类标签量化每一步骤带来的变化。这种结构不仅捕捉了事件与实体间的直接关联,还反映了程序执行过程中因果关系的递进与演变,为研究程序性文本中的时序推理与因果机制提供了细粒度的数据支撑。
使用方法
使用CREPE数据集时,研究者可将其应用于程序性文本的因果推理任务。典型方法包括基于目标与步骤序列,预测事件可能性或实体状态在每一步的变化标签。数据集以JSON格式提供,包含开发集与测试集,便于模型训练与评估。用户需注意数据列的含义与标签的语义,并参考论文中的任务定义,以构建合理的推理模型,推动程序性文本理解领域的发展。
背景与挑战
背景概述
在自然语言处理领域,程序性文本的因果推理一直是理解复杂事件链与实体状态演变的核心难题。CREPE数据集由研究团队于2023年提出,旨在探索程序性文本中事件与实体之间的因果关联。该数据集聚焦于分析步骤序列中事件发生概率与实体状态变化的动态关系,为构建能够模拟人类因果推理能力的计算模型提供了关键资源。其设计不仅推动了程序理解研究的发展,也为对话系统、智能助手等应用场景注入了新的理论支撑。
当前挑战
CREPE数据集致力于解决程序性文本中事件与实体的因果推理挑战,其核心在于准确捕捉步骤间事件可能性与实体状态的微妙变化。构建过程中,标注者需深入理解文本隐含的因果逻辑,确保事件概率与实体状态标签的一致性,这对标注者的领域知识与推理能力提出了较高要求。此外,数据集中步骤序列的多样性与现实场景的复杂性,使得模型需克服上下文依赖性强、因果链隐晦等难题,以实现稳健的推理性能。
常用场景
经典使用场景
在程序性文本理解领域,CREPE数据集为因果推理研究提供了关键支撑。该数据集通过标注步骤序列中事件与实体状态的可能性变化,典型应用于训练和评估模型对程序性文本中因果关系的动态理解能力。研究者利用其结构化标注,能够深入探究模型如何追踪多步骤过程中事件与实体的因果演变,从而推动程序性文本理解向更精细的因果推理层次发展。
解决学术问题
CREPE数据集有效应对了程序性文本中隐含因果关系的量化挑战。它通过系统标注事件可能性与实体状态的渐进变化,解决了传统方法难以捕捉动态因果影响的学术难题。该数据集为因果推理模型提供了可验证的基准,促进了事件与实体间因果链的建模研究,对提升人工智能在复杂程序理解中的逻辑推理能力具有显著意义。
衍生相关工作
围绕CREPE数据集,已衍生出多项聚焦程序性文本因果推理的经典研究。这些工作通常扩展了因果图构建或时序推理模型,利用CREPE的标注框架探索事件与实体的交互机制。部分研究进一步整合多模态信息或迁移学习策略,以深化对程序性文本中因果结构的理解,推动了自然语言处理在程序理解子领域的方法创新与理论进展。
以上内容由遇见数据集搜集并总结生成



