ARC|科学问答数据集|推理挑战数据集
收藏
- ARC数据集首次发表,由AI2(Allen Institute for AI)发布,旨在评估机器阅读理解系统在复杂推理任务中的表现。
- ARC数据集首次应用于多个机器阅读理解竞赛和研究项目中,成为评估模型推理能力的重要基准。
- ARC数据集的扩展版本发布,增加了更多的复杂推理问题,进一步推动了相关研究的发展。
- ARC数据集被广泛应用于学术界和工业界的多个研究项目中,成为衡量模型推理能力的重要工具。
- 1ARC: A Benchmark for Research on Learning from Compact LabelsUniversity of California, Berkeley · 2021年
- 2Learning from Compact Labels: A Survey on Compact Label LearningTsinghua University · 2022年
- 3Compact Label Learning for Few-Shot Image ClassificationUniversity of Science and Technology of China · 2021年
- 4ARC: A Dataset for Learning from Compact Labels in Natural Language ProcessingUniversity of Cambridge · 2021年
- 5ARC: A Benchmark for Evaluating Compact Label Learning in Medical ImagingStanford University · 2022年
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
UAVDT Dataset
The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.
datasetninja.com 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
RDD2022
RDD2022是一个多国图像数据集,用于自动道路损伤检测,由印度理工学院罗凯里分校交通系统中心等机构创建。该数据集包含来自六个国家的47,420张道路图像,标注了超过55,000个道路损伤实例。数据集通过智能手机和高分辨率相机等设备采集,旨在通过深度学习方法自动检测和分类道路损伤。RDD2022数据集的应用领域包括道路状况的自动监测和计算机视觉算法的性能基准测试,特别关注于解决多国道路损伤检测的问题。
arXiv 收录
