allenai/winogrande|常识推理数据集|文本理解数据集
收藏数据集概述
数据集名称: WinoGrande
数据集配置:
- winogrande_xs
- winogrande_s
- winogrande_m
- winogrande_l
- winogrande_xl
- winogrande_debiased
数据集特征:
- sentence: 字符串类型
- option1: 字符串类型
- option2: 字符串类型
- answer: 字符串类型
数据集分割:
配置名称 | 训练集 | 验证集 | 测试集 |
---|---|---|---|
winogrande_debiased | 9248 | 1267 | 1767 |
winogrande_l | 10234 | 1267 | 1767 |
winogrande_m | 2558 | 1267 | 1767 |
winogrande_s | 640 | 1267 | 1767 |
winogrande_xl | 40398 | 1267 | 1767 |
winogrande_xs | 160 | 1267 | 1767 |
数据集大小:
- 下载大小:3395492字节
- 数据集大小:根据不同配置变化,例如:
- winogrande_xs: 412552字节
- winogrande_s: 474156字节
- winogrande_m: 720849字节
- winogrande_l: 1711424字节
- winogrande_xl: 5577680字节
- winogrande_debiased: 1595268字节
引用信息:
@InProceedings{ai2:winogrande, title = {WinoGrande: An Adversarial Winograd Schema Challenge at Scale}, authors={Keisuke, Sakaguchi and Ronan, Le Bras and Chandra, Bhagavatula and Yejin, Choi }, year={2019} }

LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
DAT
DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。
github 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录