five

ProPara

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ProPara
下载链接
链接失效反馈
官方服务:
资源简介:
ProPara 数据集旨在训练和测试对描述过程(例如光合作用)的简单段落的理解,旨在预测、跟踪和回答有关实体在过程中如何变化的问题。 ProPara 旨在促进程序文本背景下的自然语言理解研究。这需要识别段落中描述的动作并跟踪所涉及的实体发生的状态变化。理解任务被视为预测、跟踪和回答有关实体在过程中如何变化的问题。该数据集包含 488 个段落和 3,300 个句子。在整个过程中的每个时间步(句子),每个段落都用所有主要实体(“参与者”)的存在和位置进行了丰富的注释(约 81,000 个注释)。 ProPara 段落是自然的(由众包创作)而不是合成的(例如,在 bAbI 中)。给工人一个提示(例如,“光合作用过程中发生了什么?”),然后要求他们撰写一系列描述过程中事件顺序的句子。从这些句子中,确定了参与者实体及其存在和位置。挑战的目标是根据段落中的句子预测每个参与者的存在和位置。
提供机构:
OpenDataLab
创建时间:
2022-08-11
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ProPara数据集旨在促进程序文本的自然语言理解研究,通过488个段落和3,300个句子来训练模型预测和跟踪实体在过程中的状态变化。该数据集包含丰富的实体存在和位置注释(约81,000个),数据由众包创作,专注于如光合作用等过程的描述。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作