muchomusic

Hugging Face2024-10-16 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/lmms-lab/muchomusic

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于处理音频和文本指令的交互任务。它包含一个测试集，测试集中的每个样本包括一段音频（context）、一个指令（instruction）、多个选择项（choices）和一个正确答案（answer）。

This dataset is designed for audio-text instruction interaction tasks. It comprises a test set, where each sample within the test set includes an audio segment (context), an instruction, multiple choice options (choices), and a correct answer (answer).

创建时间：

2024-10-16

原始信息汇总

数据集概述

数据集信息

数据集名称: lmms-lab/muchomusic
数据集大小: 1533064219.316 字节
下载大小: 862034562 字节

数据特征

特征列表:
- context: 音频数据
- instruction: 字符串
- choices: 字符串
- answer: 字符串

数据分割

分割名称: test
- 样本数量: 1187
- 数据大小: 1533064219.316 字节

配置信息

配置名称: default
- 数据文件路径: data/test-*

搜集汇总

数据集介绍

构建方式

MuChoMusic数据集的构建基于多模态音频-语言模型（Audio LLMs）的音乐理解评估需求。该数据集从MusicCaps和Song Describer Dataset（SDD）两个公开音乐数据集中选取了644首音乐曲目，并生成了1,187道多项选择题。这些题目涵盖了音乐理论、文化背景和功能应用等多个维度，旨在全面评估模型对音乐的理解能力。所有问题与答案均经过人工标注者的验证，确保了数据的高质量与可靠性。

特点

MuChoMusic数据集的特点在于其多模态特性，结合了音频与文本信息，为模型提供了丰富的上下文环境。数据集中每道题目均包含音频片段、问题描述、选项及正确答案，能够有效测试模型在音乐领域的推理与理解能力。此外，数据集的高采样率（192kHz）确保了音频数据的精细度，为模型训练与评估提供了高质量的输入。

使用方法

MuChoMusic数据集主要用于评估多模态音频-语言模型在音乐理解任务中的表现。用户可通过加载数据集中的音频与文本信息，结合问题与选项，测试模型在音乐理论、文化背景等维度的推理能力。该数据集已集成至lmms-eval框架中，用户可通过该框架便捷地进行模型评估与对比分析。数据集的开放性与高质量使其成为音乐理解研究的重要工具。

背景与挑战

背景概述

MuChoMusic数据集作为一项多模态音频-语言模型（Audio LLMs）的基准测试工具，旨在评估模型在音乐理解方面的能力。该数据集由1,187道多选题构成，基于644首音乐曲目，数据源自MusicCaps和Song Describer Dataset（SDD）两个公开的音乐数据集。MuChoMusic通过测试音乐理论、文化背景及功能应用等维度的知识与推理能力，为模型评估提供了高质量的标准。所有问题与答案均经过人工标注验证，确保了数据的可靠性。该数据集由mulab-mir团队创建，并遵循Creative Commons Attribution 4.0 License（CC BY 4.0）许可协议，旨在支持lmms-eval框架下的多模态模型评估研究。

当前挑战

MuChoMusic数据集在构建与应用过程中面临多重挑战。首先，音乐理解涉及复杂的多维度知识，包括音乐理论、文化背景及功能应用等，如何设计能够全面评估模型能力的问题是一大难点。其次，数据集的构建依赖于高质量的音乐曲目与标注，确保数据来源的多样性与标注的准确性对数据集的可靠性至关重要。此外，多模态模型的评估需要兼顾音频与语言信息的融合，如何在测试中平衡两者的权重并设计合理的评估指标，也是该数据集应用中的核心挑战。这些挑战不仅影响数据集的构建质量，也直接关系到其在多模态模型研究中的实际应用效果。

常用场景

经典使用场景

MuChoMusic数据集在音乐理解领域具有重要应用，特别是在评估多模态音频-语言模型的性能方面。该数据集通过提供1187道多项选择题，涵盖了音乐理论、文化背景和功能应用等多个维度，能够全面测试模型对音乐的理解和推理能力。研究人员可以利用这一数据集，深入探讨模型在处理复杂音乐信息时的表现，从而推动音乐理解技术的发展。

衍生相关工作

MuChoMusic数据集的发布，催生了一系列相关研究工作。例如，基于该数据集的评估框架lmms-eval，为多模态模型的性能评估提供了标准化工具。此外，许多研究团队利用该数据集，开发了新的音乐理解模型和算法，进一步推动了音乐理解技术的发展。这些工作不仅丰富了音乐理解领域的研究内容，也为实际应用提供了更多可能性。

数据集最近研究