biu-nlp/qa_align
收藏Hugging Face2025-06-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/biu-nlp/qa_align
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含跨文本内容重叠的细粒度注释,任务输入是来自两个文档的两个句子,这些句子大致描述同一事件,并带有QA-SRL注释,这些注释以问答格式捕捉动词谓词-论元关系。输出是表示相同信息的QA集之间的跨句子对齐。数据集格式包括唯一的句子ID、候选句子及其上下文、每个句子的QASRL QA集以及工人匹配的对齐QA。
提供机构:
biu-nlp
原始信息汇总
数据集概述
数据集名称:QA-Align
内容描述: QA-Align数据集包含细粒度的跨文本内容重叠标注,即QA对齐。任务输入为来自两个文档的两句话,大致讨论同一事件,并附有QA-SRL标注,这些标注以问答形式捕捉动词谓词-论元关系。输出为表示相同信息的QA集合之间的跨句子对齐。
数据集特征:
abs_sent_id_1,abs_sent_id_2:唯一句子ID,跨所有数据源唯一。text_1,text_2,prev_text_1,prev_text_2:用于对齐的两个候选句子及其上下文。qas_1,qas_2:每个句子对应的QASRL QA集合。测试和开发集由工作者创建,训练集由QASRL解析器生成。alignments:工作者匹配的对齐QA,每个对齐包含多个QA对。
对齐类型:
- 96%为一对一对齐。
- 4%包含多对多对齐,其中大部分为2对1。



