sangeetkar-teacher-labels

Hugging Face2026-01-04 更新2026-01-05 收录

下载链接：

https://huggingface.co/datasets/beastLucifer/sangeetkar-teacher-labels

下载链接

链接失效反馈

官方服务：

资源简介：

Ostrich音乐情绪蒸馏标签数据集是一个高质量的多标签音乐情绪数据集，专门设计用于从CLAP教师模型中提取知识到轻量级学生模型。该数据集包含6870个30秒的宝莱坞音乐片段样本，每个样本被分割成2个15秒的片段进行标注。数据集采用多标签二进制选择方式，基于CLAP-HTSAT模型的高置信度分数生成31个情绪标签，涵盖核心情绪（如活力、平静、快乐、悲伤等）、文化灵魂（如Dard-bhari、Masti、Sufi-romantic等）、氛围（如Chill-lofi、Hype Party等）、声音特征（如极简、极繁等）和节奏（如慢燃、中速、快节奏）等多个维度。每个歌曲样本强制实施1-3个活跃标签的稀疏性约束。

创建时间：

2026-01-01

原始信息汇总

数据集概述

基本信息

数据集名称: Ostrich Surgical Mood Beliefs
托管地址: https://huggingface.co/datasets/beastLucifer/sangeetkar-teacher-labels
语言: 印地语 (hi), 英语 (en)
许可证: MIT
任务类别: 音频分类
标签: 音乐, 宝莱坞, 蒸馏, 鸵鸟 (ostrich)
规模类别: 1K<n<10K

数据集描述

该数据集包含一个CLAP教师模型生成的高精度连续情绪信念，用于将知识蒸馏到轻量级的 Ostrich 学生模型中。

数据集统计

样本数量: 6862
音频窗口: 每段音频的前15秒
数值范围: 连续概率值 [0, 1]

情绪标签

数据集包含以下8种情绪的概率值：Energetic（充满活力）, Calm（平静）, Happy（快乐）, Sad（悲伤）, Angry（愤怒）, Romantic（浪漫）, Mysterious（神秘）, Nostalgic（怀旧）。

使用方式

可通过 datasets 库加载数据集，示例如下： python from datasets import load_dataset ds = load_dataset("beastLucifer/sangeetkar-teacher-labels", split="train") sample = ds[0] primary = max({k: sample[k] for k in [Energetic, Calm, Happy, Sad, Angry, Romantic, Mysterious, Nostalgic]}, key=lambda k: sample[k]) print(primary)

搜集汇总

数据集介绍

构建方式

在音乐情感计算领域，Ostrich数据集通过知识蒸馏框架构建，其核心在于利用预训练的CLAP教师模型对印地语与英语混合的宝莱坞音乐片段进行高精度情感标注。该模型针对每首歌曲的前15秒音频窗口，生成了涵盖八种情感维度的连续概率值，这些概率值介于0到1之间，形成了6862个标注样本。整个构建过程体现了从复杂教师模型到轻量级学生模型的知识传递逻辑，确保了标注结果在连续情感空间中的细腻性与可靠性。

使用方法

研究人员可通过Hugging Face的datasets库直接加载该数据集，便捷地获取音频片段对应的多维情感概率向量。典型的使用场景是将其作为监督信号，用于训练轻量化的学生模型，实现高效的音乐情感分类或回归。代码示例展示了如何加载数据并提取主导情感类别，为后续的模型训练或分析提供基础。该数据集的设计天然契合知识蒸馏流程，能够助力开发在资源受限环境下仍保持高精度的音乐情感识别系统。

背景与挑战

背景概述

在音乐信息检索领域，情感分析作为一项核心任务，旨在通过计算模型自动识别音乐片段所传达的情绪状态。sangeetkar-teacher-labels数据集由研究团队于近期构建，专注于印度宝莱坞音乐的情感标注。该数据集利用CLAP教师模型生成高精度的连续情绪概率标签，服务于知识蒸馏至轻量级Ostrich学生模型，以推动高效音乐情感识别技术的发展。其标注涵盖八种情绪维度，包括活力、平静、快乐、悲伤等，为跨语言音乐情感计算提供了重要数据支撑，并促进了资源受限环境下的模型部署。

当前挑战

该数据集致力于解决音乐情感自动分类的挑战，特别是在多语言和跨文化语境中，准确捕捉音乐所蕴含的复杂情绪状态存在显著难度。构建过程中，研究人员面临的主要挑战包括：如何确保CLAP教师模型在宝莱坞音乐这一特定领域生成高质量且一致的连续概率标签，以及如何在知识蒸馏过程中有效保留教师模型的语义信息，同时适应学生模型的轻量化约束。此外，数据集的规模相对有限，可能影响模型在更广泛音乐风格上的泛化能力，这要求后续研究需进一步探索数据增强或跨域迁移策略。

常用场景

经典使用场景

在音乐信息检索领域，sangeetkar-teacher-labels数据集为轻量级学生模型的知识蒸馏提供了关键支持。该数据集通过CLAP教师模型生成了高精度的连续情绪信念，覆盖了宝莱坞音乐中八种核心情绪类别，如活力、平静、快乐、悲伤等。研究者通常利用这些精细的教师标签，指导学生模型学习音乐片段的情绪概率分布，从而在资源受限的设备上实现高效的音乐情绪分类任务。

解决学术问题

该数据集有效解决了音乐情绪自动标注中标注成本高昂与主观偏差的学术难题。通过提供大规模、高质量的连续概率标签，它促进了知识蒸馏技术在音频分类领域的深入应用，使得轻量级模型能够继承复杂教师模型的判别能力。这不仅推动了模型压缩与高效推理的研究，也为跨语言音乐情绪分析提供了可靠的数据基准，显著提升了学术研究的可复现性与比较性。

实际应用

在实际应用中，sangeetkar-teacher-labels数据集支撑了智能音乐推荐系统与个性化内容分发的开发。基于其提供的情绪概率，系统能够精准识别用户偏好，实现动态播放列表生成与情境化音乐匹配。此外，该数据集还可用于电影配乐自动选择、心理健康辅助工具中的情绪调节音乐推荐，以及跨文化音乐研究，为娱乐产业与健康科技领域提供了数据驱动的解决方案。

数据集最近研究