five

ErnestSDavis/winograd_wsc|语言理解数据集|技术挑战数据集

收藏
hugging_face2024-01-18 更新2024-05-25 收录
语言理解
技术挑战
下载链接:
https://hf-mirror.com/datasets/ErnestSDavis/winograd_wsc
下载链接
链接失效反馈
资源简介:
Winograd Schema Challenge数据集用于测试AI系统在常识性语言理解方面的能力。该数据集包含成对的句子,这些句子仅在少数词汇上有所不同,且包含需要通过世界知识和推理来解决的歧义。数据集由专家生成,包含285个测试实例,每个实例包含一个文本段落、一个指定的代词和两个可能的答案,指示代词在段落中代表哪个实体。数据集为英文,且仅包含测试集。

Winograd Schema Challenge数据集用于测试AI系统在常识性语言理解方面的能力。该数据集包含成对的句子,这些句子仅在少数词汇上有所不同,且包含需要通过世界知识和推理来解决的歧义。数据集由专家生成,包含285个测试实例,每个实例包含一个文本段落、一个指定的代词和两个可能的答案,指示代词在段落中代表哪个实体。数据集为英文,且仅包含测试集。
提供机构:
ErnestSDavis
原始信息汇总

数据集概述

  • 名称: Winograd Schema Challenge
  • 别名: WSC
  • 语言: 英语
  • 许可证: CC-BY-4.0
  • 多语言性: 单语种
  • 大小: 小于1000条数据
  • 源数据: 原创数据
  • 任务类别: 多选题
  • 任务ID: 多选题-指代消解
  • 论文代码ID: wsc
  • 美观名称: Winograd Schema Challenge

数据集结构

配置信息

  • wsc285

    • 特征:
      • text: 字符串
      • pronoun: 字符串
      • pronoun_loc: 整数
      • quote: 字符串
      • quote_loc: 整数
      • options: 字符串序列
      • label: 类别标签,值为0或1
      • source: 字符串
    • 分割:
      • test: 285个实例,数据大小52281字节
    • 下载大小: 113235字节
    • 数据集大小: 52281字节
  • wsc273

    • 特征:
      • text: 字符串
      • pronoun: 字符串
      • pronoun_loc: 整数
      • quote: 字符串
      • quote_loc: 整数
      • options: 字符串序列
      • label: 类别标签,值为0或1
      • source: 字符串
    • 分割:
      • test: 273个实例,数据大小49674字节
    • 下载大小: 113235字节
    • 数据集大小: 49674字节

数据实例结构

  • 文本: 包含指代词和两个可能答案的文本段落
  • 选项: 指代词可能指代的两个实体
  • 标签: 正确答案的索引
  • 指代词: 需要解析的指代词
  • 指代词位置: 指代词在序列中的起始位置
  • 引用: 指代词周围的关键动作或上下文
  • 引用位置: 引用在序列中的起始位置
  • 来源: 贡献该实例的来源描述
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

Tropicos

Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。

www.tropicos.org 收录

DAT

DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。

github 收录

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录