ARC|科学问答数据集|推理挑战数据集
收藏
- ARC数据集首次发表,由AI2(Allen Institute for AI)发布,旨在评估机器阅读理解系统在复杂推理任务中的表现。
- ARC数据集首次应用于多个机器阅读理解竞赛和研究项目中,成为评估模型推理能力的重要基准。
- ARC数据集的扩展版本发布,增加了更多的复杂推理问题,进一步推动了相关研究的发展。
- ARC数据集被广泛应用于学术界和工业界的多个研究项目中,成为衡量模型推理能力的重要工具。
- 1ARC: A Benchmark for Research on Learning from Compact LabelsUniversity of California, Berkeley · 2021年
- 2Learning from Compact Labels: A Survey on Compact Label LearningTsinghua University · 2022年
- 3Compact Label Learning for Few-Shot Image ClassificationUniversity of Science and Technology of China · 2021年
- 4ARC: A Dataset for Learning from Compact Labels in Natural Language ProcessingUniversity of Cambridge · 2021年
- 5ARC: A Benchmark for Evaluating Compact Label Learning in Medical ImagingStanford University · 2022年
LEGO数据集
该数据集包含了关于LEGO公司的历史、产品提供以及特定LEGO套装的信息,用于分析LEGO套装的规模、发布年份、主题分布以及套装复杂性的变化。
github 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
music-genres-dataset
包含1494个音乐流派的数据集,每个流派有200首歌曲。每首歌曲提供以下属性:艺术家、歌曲名称、在列表中的位置、主流派、子流派(含流行度计数)、标签(非现有流派的标签,如情感等,也含流行度计数)。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录