ErnestSDavis/winograd_wsc|语言理解数据集|技术挑战数据集
收藏数据集概述
- 名称: Winograd Schema Challenge
- 别名: WSC
- 语言: 英语
- 许可证: CC-BY-4.0
- 多语言性: 单语种
- 大小: 小于1000条数据
- 源数据: 原创数据
- 任务类别: 多选题
- 任务ID: 多选题-指代消解
- 论文代码ID: wsc
- 美观名称: Winograd Schema Challenge
数据集结构
配置信息
-
wsc285
- 特征:
text
: 字符串pronoun
: 字符串pronoun_loc
: 整数quote
: 字符串quote_loc
: 整数options
: 字符串序列label
: 类别标签,值为0或1source
: 字符串
- 分割:
test
: 285个实例,数据大小52281字节
- 下载大小: 113235字节
- 数据集大小: 52281字节
- 特征:
-
wsc273
- 特征:
text
: 字符串pronoun
: 字符串pronoun_loc
: 整数quote
: 字符串quote_loc
: 整数options
: 字符串序列label
: 类别标签,值为0或1source
: 字符串
- 分割:
test
: 273个实例,数据大小49674字节
- 下载大小: 113235字节
- 数据集大小: 49674字节
- 特征:
数据实例结构
- 文本: 包含指代词和两个可能答案的文本段落
- 选项: 指代词可能指代的两个实体
- 标签: 正确答案的索引
- 指代词: 需要解析的指代词
- 指代词位置: 指代词在序列中的起始位置
- 引用: 指代词周围的关键动作或上下文
- 引用位置: 引用在序列中的起始位置
- 来源: 贡献该实例的来源描述
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
Tropicos
Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。
www.tropicos.org 收录
DAT
DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。
github 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录