five

lasha-nlp/CONDAQA|自然语言处理数据集|阅读理解数据集

收藏
hugging_face2022-11-08 更新2024-03-04 收录
自然语言处理
阅读理解
下载链接:
https://hf-mirror.com/datasets/lasha-nlp/CONDAQA
下载链接
链接失效反馈
资源简介:
CondaQA是一个用于推理否定语句的对比阅读理解数据集,旨在促进未来模型在处理否定语句方面的有效发展。这是第一个需要推理段落中否定语句含义的英文阅读理解数据集。数据集包含14,182个问答对,涵盖了200多种独特的否定提示。通过众包方式,数据集的段落经过了三种编辑:否定语句的改写、否定范围的修改以及否定语句的反转,从而形成了一组难以通过虚假线索回答的问答对。数据集的结构包括原始段落、编辑后的段落、问题及其答案,数据字段包括QuestionID、original cue、PassageEditID、original passage、SampleID、label、original sentence、sentence2、PassageID和sentence1。数据集的任务是回答包含否定语句的维基百科段落中的问题,目前没有官方排行榜。
提供机构:
lasha-nlp
原始信息汇总

数据集概述

名称: CondaQA

描述: CondaQA是一个英语阅读理解数据集,专注于推理关于否定句的含义。它是首个要求对段落中否定句的含义进行推理的英语阅读理解数据集。数据集包含14,182个问答对,涵盖超过200种独特的否定提示。

语言: 英语

许可证: Apache-2.0

大小: 10K<n<100K

任务: 问答

特点: 数据集通过对比阅读理解任务,评估模型处理否定句含义的能力。每个实例包括一个问题和相关的段落,其中包含否定句。

数据集结构

数据实例: 每个实例包含问题ID、原始提示、段落编辑ID、原始段落、样本ID、标签、原始句子、问题、段落ID和段落。

数据字段:

  • QuestionID: 问题唯一ID
  • original cue: 用于从维基百科中选择段落的否定提示
  • PassageEditID: 段落编辑类型标识
  • original passage: 原始维基百科段落
  • SampleID: 段落-问题对唯一ID
  • label: 答案
  • original sentence: 包含否定句的句子
  • sentence2: 问题
  • PassageID: 维基百科段落唯一ID
  • sentence1: 段落

数据分割: 数据集分为训练集、开发集和测试集。

数据集创建

来源数据: 数据集基于2021年7月的英语维基百科段落,包含各种否定提示。

注释过程: 通过众包工作者进行,他们首先对原始段落进行三种类型的编辑(重述否定句、改变否定范围、反转否定),然后提出关于否定句含义的挑战性问题,并回答这些问题。

注释者: 通过资格考试筛选的众包工作者。

使用数据集的考虑

社会影响: 模型解决此数据集的能力可能被误解为对英语语言全面理解的能力,可能影响模型的部署和应用。

已知限制: 数据集目前是最大的评估模型处理否定句含义能力的数据集,但仍有可能构建更大的数据集,并扩展到其他语言。

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Materials Project 在线材料数据库

Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。

超神经 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

frames-benchmark

FRAMES数据集是一个综合评估数据集,旨在测试检索增强生成(RAG)系统在事实性、检索准确性和推理方面的能力。该数据集包含824个具有挑战性的多跳问题,这些问题需要从2到15篇维基百科文章中获取信息。问题涵盖了历史、体育、科学、动物、健康等多个主题,并且每个问题都标有推理类型,如数值、表格、多重约束、时间性和后处理。数据集还提供了每个问题的黄金答案和相关的维基百科文章。FRAMES数据集的主要特点包括测试端到端的RAG能力、需要整合来自多个来源的信息、包含复杂的推理和时间性消歧,并设计为对最先进的语言模型具有挑战性。该数据集可用于评估RAG系统性能、基准测试语言模型的事实性和推理能力,以及开发和测试多跳检索策略。

huggingface 收录