lasha-nlp/CONDAQA|自然语言处理数据集|阅读理解数据集
收藏数据集概述
名称: CondaQA
描述: CondaQA是一个英语阅读理解数据集,专注于推理关于否定句的含义。它是首个要求对段落中否定句的含义进行推理的英语阅读理解数据集。数据集包含14,182个问答对,涵盖超过200种独特的否定提示。
语言: 英语
许可证: Apache-2.0
大小: 10K<n<100K
任务: 问答
特点: 数据集通过对比阅读理解任务,评估模型处理否定句含义的能力。每个实例包括一个问题和相关的段落,其中包含否定句。
数据集结构
数据实例: 每个实例包含问题ID、原始提示、段落编辑ID、原始段落、样本ID、标签、原始句子、问题、段落ID和段落。
数据字段:
QuestionID
: 问题唯一IDoriginal cue
: 用于从维基百科中选择段落的否定提示PassageEditID
: 段落编辑类型标识original passage
: 原始维基百科段落SampleID
: 段落-问题对唯一IDlabel
: 答案original sentence
: 包含否定句的句子sentence2
: 问题PassageID
: 维基百科段落唯一IDsentence1
: 段落
数据分割: 数据集分为训练集、开发集和测试集。
数据集创建
来源数据: 数据集基于2021年7月的英语维基百科段落,包含各种否定提示。
注释过程: 通过众包工作者进行,他们首先对原始段落进行三种类型的编辑(重述否定句、改变否定范围、反转否定),然后提出关于否定句含义的挑战性问题,并回答这些问题。
注释者: 通过资格考试筛选的众包工作者。
使用数据集的考虑
社会影响: 模型解决此数据集的能力可能被误解为对英语语言全面理解的能力,可能影响模型的部署和应用。
已知限制: 数据集目前是最大的评估模型处理否定句含义能力的数据集,但仍有可能构建更大的数据集,并扩展到其他语言。
Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录
frames-benchmark
FRAMES数据集是一个综合评估数据集,旨在测试检索增强生成(RAG)系统在事实性、检索准确性和推理方面的能力。该数据集包含824个具有挑战性的多跳问题,这些问题需要从2到15篇维基百科文章中获取信息。问题涵盖了历史、体育、科学、动物、健康等多个主题,并且每个问题都标有推理类型,如数值、表格、多重约束、时间性和后处理。数据集还提供了每个问题的黄金答案和相关的维基百科文章。FRAMES数据集的主要特点包括测试端到端的RAG能力、需要整合来自多个来源的信息、包含复杂的推理和时间性消歧,并设计为对最先进的语言模型具有挑战性。该数据集可用于评估RAG系统性能、基准测试语言模型的事实性和推理能力,以及开发和测试多跳检索策略。
huggingface 收录