ProPara
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ProPara
下载链接
链接失效反馈官方服务:
资源简介:
ProPara 数据集旨在训练和测试对描述过程(例如光合作用)的简单段落的理解,旨在预测、跟踪和回答有关实体在过程中如何变化的问题。 ProPara 旨在促进程序文本背景下的自然语言理解研究。这需要识别段落中描述的动作并跟踪所涉及的实体发生的状态变化。理解任务被视为预测、跟踪和回答有关实体在过程中如何变化的问题。该数据集包含 488 个段落和 3,300 个句子。在整个过程中的每个时间步(句子),每个段落都用所有主要实体(“参与者”)的存在和位置进行了丰富的注释(约 81,000 个注释)。 ProPara 段落是自然的(由众包创作)而不是合成的(例如,在 bAbI 中)。给工人一个提示(例如,“光合作用过程中发生了什么?”),然后要求他们撰写一系列描述过程中事件顺序的句子。从这些句子中,确定了参与者实体及其存在和位置。挑战的目标是根据段落中的句子预测每个参与者的存在和位置。
提供机构:
OpenDataLab
创建时间:
2022-08-11
搜集汇总
数据集介绍

背景与挑战
背景概述
ProPara数据集旨在促进程序文本的自然语言理解研究,通过488个段落和3,300个句子来训练模型预测和跟踪实体在过程中的状态变化。该数据集包含丰富的实体存在和位置注释(约81,000个),数据由众包创作,专注于如光合作用等过程的描述。
以上内容由遇见数据集搜集并总结生成



