MMAR|音频语言模型数据集|深度推理数据集
收藏MMAR数据集概述
数据集简介
- 名称: MMAR (A Challenging Benchmark for Deep Reasoning in Speech, Audio, Music, and Their Mix)
- 目的: 评估音频语言模型(ALMs)在多学科任务中的深度推理能力
- 规模: 包含1,000个精心策划的音频-问题-答案三元组
- 数据来源: 来自真实世界的互联网视频
数据特点
-
高质量数据:
- 通过迭代错误修正和质量检查确保高质量
- 每个项目都需要超越表面理解的多步深度推理
- 部分问题需要研究生水平的感知和领域特定知识
-
多模态覆盖:
- 传统模态: 语音、音频、音乐
- 扩展模态: 上述模态的混合(来自野外视频)
-
丰富标注:
- 每个问题标注有指定类别和子类别
- 提供原始视频URL和时间戳
- 标注片段中的口语语言(如存在)
数据集结构
- 元数据文件: MMAR-meta.json
- 数据分布可视化:
- 模态分布饼图
- 类别和子类别旭日图
基准测试
- 测试模型类别:
- 大型音频语言模型(LALMs)
- 大型音频推理模型(LARMs)
- 全能语言模型(OLMs)
- 使用音频字幕作为输入的大型语言模型(LLMs)
- 使用音频字幕作为输入的大型推理模型(LRMs)
数据集创建流程
- 构思具有挑战性的问题
- 通过人-LLM协作构建分类法
- 基于启发式的数据收集和标注
- 爬取音频数据并丰富多个槽位的内容
- 执行迭代修正和质量检查以确保高数据保真度
评估方法
- 基于MMAU的改进评估方法
- 评估脚本: evaluation.py
- 输入要求: 与MMAR-meta.json格式相同,增加model_prediction字段存储模型预测
资源链接
- 音频下载: https://huggingface.co/datasets/BoJack/MMAR
- 演示视频: https://www.youtube.com/watch?v=Dab13opIGqU
- GitHub代码: https://github.com/ddlBoJack/MMAR

2022_张家界市标准地图行政区划示意版32开
基于湖南省基础地理信息数据库,依据湖南省行政区划界线标准画法和最新境界、标准地名成果,采用其他自然地理要素和人文专题要素的现势性资料编制而成。
湖南大数据交易所 收录
BBGRE
The Brain & Body Genetic Resource Exchange (BBGRE) provides a resource for investigating the genetic basis of neurodisability. It combines phenotype information from patients with neurodevelopmental and behavioural problems with clinical genetic data, and displays this information on the human genome map.
国家生物信息中心 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
Global Burden of Disease (GBD) Study
全球疾病负担研究(GBD)是一个综合性的全球健康评估项目,旨在量化全球、国家和地方层面的疾病、伤害和风险因素的负担。数据集包括各种健康指标,如死亡率、发病率、残疾调整生命年(DALYs)等,涵盖了多种疾病和伤害,以及多种风险因素。
ghdx.healthdata.org 收录
NWD978725.freeze5.v1.vcf.gz.csi
TOPMed: NWD978725.freeze5.v1.vcf.gz.csi <br>File: VCF CSI file
DataCite Commons 收录