neg_meow
收藏Hugging Face2025-06-23 更新2025-06-24 收录
下载链接:
https://huggingface.co/datasets/akiq2016/neg_meow
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含音频文件的数据库,每个音频文件都带有多种特征信息,包括但不限于文件名、音频持续时间、二分类标签(负面或正面)、主要情绪状态(如攻击性或痛苦)、行为背景和环境背景(均标记为未知)。每个音频还有一个置信度评分、是否经过审核的标记以及备注。数据集分为训练集和测试集,其中训练集包含740个示例,测试集包含185个示例。
创建时间:
2025-06-23
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 下载大小: 245392749 字节
- 数据集大小: 248562609.0 字节
数据特征
- audio: 音频数据
- filename: 文件名(字符串类型)
- duration: 持续时间(float32类型)
- binary_label: 二元标签(0: negative, 1: positive)
- Primary_Emotional_States: 主要情绪状态(0: aggressive, 1: distress)
- Behavioral_Contexts: 行为背景(0: Unknown)
- Environmental_Contexts: 环境背景(0: Unknown)
- confidence: 置信度(float32类型)
- reviewed: 是否已审核(int32类型)
- is_kitten: 是否为幼猫(0: Unknown)
- notes: 备注(字符串类型)
- clap_top_class: 顶部类别(字符串类型)
- clap_top_confidence: 顶部置信度(float32类型)
- clap_second_class: 第二类别(字符串类型)
- clap_second_confidence: 第二置信度(float32类型)
- clap_third_class: 第三类别(字符串类型)
- clap_third_confidence: 第三置信度(float32类型)
- clap_cat_confidence: 猫类别置信度(float32类型)
- clap_is_cat_top: 猫类别是否为顶部(布尔类型)
- clap_cat_position: 猫类别位置(int32类型)
数据分割
- train:
- 样本数量: 740
- 数据大小: 201215794.2 字节
- test:
- 样本数量: 185
- 数据大小: 47346814.8 字节
配置文件
- config_name: default
- train: data/train-*
- test: data/test-*
搜集汇总
数据集介绍

构建方式
在动物行为学研究领域,neg_meow数据集通过系统采集猫科动物发声样本构建而成。该数据集包含925条音频样本,采用专业录音设备在自然环境中录制,并通过人工标注与机器学习相结合的方式进行多维度标注。每条样本均标注有持续时间、二元情感标签(积极/消极)、主要情绪状态(攻击性/痛苦等)以及环境上下文信息,同时包含CLAP模型预测的置信度数据,确保标注体系的科学性和可验证性。
特点
neg_meow数据集最显著的特征在于其多层次的情感标注体系。除基础的二元分类标签外,还包含精细化的情绪状态分类和行为场景标注。数据集特别设计了置信度评估指标,每个样本均附有CLAP音频分类模型的三级预测结果及其置信度评分,为研究猫科动物情感识别提供了可靠的基准数据。740条训练样本和185条测试样本的划分比例,既保证了模型训练的需求,也提供了足够的验证数据。
使用方法
该数据集适用于动物行为学和计算听觉场景分析研究。研究者可通过加载音频文件及其对应的多维标签,开展猫科动物情感识别模型的训练与评估。数据集兼容HuggingFace标准接口,支持直接调用datasets库进行加载。对于机器学习应用,建议重点关注binary_label和Primary_Emotional_States字段,结合clap系列字段的置信度评分进行数据质量控制。环境上下文字段可为跨场景泛化研究提供支持。
背景与挑战
背景概述
neg_meow数据集是一个专注于猫科动物声音情感识别的音频数据集,由匿名研究团队在2023年构建并公开发布。该数据集通过收集猫在不同情绪状态下的发声样本,旨在解决动物行为学中情感识别的核心问题。数据集包含740个训练样本和185个测试样本,每个样本均标注了二元情感标签(积极/消极)和主要情绪状态(攻击性/痛苦),并辅以行为环境、置信度等元数据。其多维度标注体系为计算生物声学领域提供了首个可量化的猫科动物情感分析基准,对促进人类与动物的情感交互研究具有开创性意义。
当前挑战
在领域问题层面,该数据集面临猫科动物情感状态难以客观量化的挑战,现有标注体系可能无法完全捕捉发声的复杂情感维度。音频样本中环境噪声的干扰与个体发声差异为特征提取带来困难,而未知行为环境标签的比例较高也限制了模型的泛化能力。在构建过程中,研究团队需要克服样本收集的伦理约束,确保录音过程不引起动物应激反应。多标注者间信度的维持、跨品种发声差异的平衡,以及机器学习模型对细微声学特征的捕捉能力,都是构建高质量数据集过程中亟待解决的技术难题。
常用场景
经典使用场景
在动物行为学与情感计算领域,neg_meow数据集通过标注猫叫声的二元标签(积极/消极)和主要情感状态(攻击性/痛苦),为研究者提供了分析猫科动物情感表达的标准化素材。其音频特征与多维度标注的结合,使得该数据集成为训练情感识别模型的理想选择,尤其在跨物种情感理解研究中具有独特价值。
解决学术问题
该数据集有效解决了动物情感识别中缺乏标准化标注数据的核心难题,通过精确标注的叫声样本,支持机器学习模型区分猫的负面情绪状态。其多层次标注体系(包括情感类型、行为背景等)为探究非人类生物的情感表达机制提供了量化研究基础,推动了跨学科的情感计算研究进展。
衍生相关工作
该数据集催生了多项创新研究,包括基于多模态特征的猫情感状态分类器开发,以及跨物种情感迁移学习框架的构建。部分学者进一步扩展其标注体系,建立了猫科动物情感表达谱系,相关成果发表于《动物认知》等权威期刊,形成了动物计算研究的新分支。
以上内容由遇见数据集搜集并总结生成



