five

biu-nlp/qa_align

收藏
Hugging Face2025-06-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/biu-nlp/qa_align
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含跨文本内容重叠的细粒度注释,任务输入是来自两个文档的两个句子,这些句子大致描述同一事件,并带有QA-SRL注释,这些注释以问答格式捕捉动词谓词-论元关系。输出是表示相同信息的QA集之间的跨句子对齐。数据集格式包括唯一的句子ID、候选句子及其上下文、每个句子的QASRL QA集以及工人匹配的对齐QA。
提供机构:
biu-nlp
原始信息汇总

数据集概述

数据集名称:QA-Align

内容描述: QA-Align数据集包含细粒度的跨文本内容重叠标注,即QA对齐。任务输入为来自两个文档的两句话,大致讨论同一事件,并附有QA-SRL标注,这些标注以问答形式捕捉动词谓词-论元关系。输出为表示相同信息的QA集合之间的跨句子对齐。

数据集特征

  • abs_sent_id_1, abs_sent_id_2:唯一句子ID,跨所有数据源唯一。
  • text_1, text_2, prev_text_1, prev_text_2:用于对齐的两个候选句子及其上下文。
  • qas_1, qas_2:每个句子对应的QASRL QA集合。测试和开发集由工作者创建,训练集由QASRL解析器生成。
  • alignments:工作者匹配的对齐QA,每个对齐包含多个QA对。

对齐类型

  • 96%为一对一对齐。
  • 4%包含多对多对齐,其中大部分为2对1。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作