five

ProPara

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/ProPara
下载链接
链接失效反馈
官方服务:
资源简介:
ProPara 数据集旨在训练和测试对描述过程(例如光合作用)的简单段落的理解,旨在预测、跟踪和回答有关实体在过程中如何变化的问题。 ProPara 旨在促进程序文本背景下的自然语言理解研究。这需要识别段落中描述的动作并跟踪所涉及的实体发生的状态变化。理解任务被视为预测、跟踪和回答有关实体在过程中如何变化的问题。该数据集包含 488 个段落和 3,300 个句子。在整个过程中的每个时间步(句子),每个段落都用所有主要实体(“参与者”)的存在和位置进行了丰富的注释(约 81,000 个注释)。 ProPara 段落是自然的(由众包创作)而不是合成的(例如,在 bAbI 中)。给工人一个提示(例如,“光合作用过程中发生了什么?”),然后要求他们撰写一系列描述过程中事件顺序的句子。从这些句子中,确定了参与者实体及其存在和位置。挑战的目标是根据段落中的句子预测每个参与者的存在和位置。
提供机构:
OpenDataLab
创建时间:
2022-08-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作