ARB|复杂推理数据集|多学科评估数据集
收藏Advanced Reasoning Benchmark (ARB) 数据集概述
基本信息
- 名称: Advanced Reasoning Benchmark (ARB)
- 维护机构: DuckAI
- 合作机构: 乔治亚理工学院、苏黎世联邦理工学院、Nomos AI、斯坦福大学法律信息学中心、Mila - Quebec AI Institute
- 许可证: MIT
- 相关论文: arXiv:2307.13692
数据集简介
ARB是一个新颖的基准测试数据集,由高级推理问题组成,旨在评估大型语言模型(LLMs)在文本理解和专业领域推理方面的能力。该数据集比现有基准更具挑战性,包含测试数学、物理、生物、化学和法律领域深层知识的问题。
API访问
- 端点URL: https://advanced-reasoning-benchmark.netlify.app/api/
- 完整REST API文档: API文档

OpenPose
OpenPose数据集包含人体姿态估计的相关数据,主要用于训练和评估人体姿态检测算法。数据集包括多视角的图像和视频,标注了人体关键点位置,适用于研究人体姿态识别和动作分析。
github.com 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
cricket_data
该数据集包含了多种板球比赛的数据,包括每场比赛的详细信息,如比赛日期、地点、参赛队伍、比赛结果等。数据以文件形式存储,每个文件对应不同的比赛信息,如投球数据、比赛日期、比赛信息、比赛详情、元数据、比赛结果、最有价值球员、超级替补、参赛队伍、抛硬币结果和裁判员信息等。
github 收录
Autism-Datasets
收集了一些关于自闭症的数据集。
github 收录