CatMeows|猫行为研究数据集|声音分析数据集

huggingface2024-08-02 更新2024-12-12 收录

猫行为研究

声音分析

下载链接：

https://huggingface.co/datasets/zeddez/CatMeows

下载链接

链接失效反馈

资源简介：

该数据集包含440个声音样本，由21只属于两个品种（缅因州库恩猫和欧洲短毛猫）的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定，包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外，还有一个额外的zip文件，包含被排除的录音（非喵声）和未剪辑的连续发声序列。

创建时间：

2024-08-02

原始信息汇总

CatMeows 数据集概述

数据集简介

CatMeows 数据集包含440个声音文件，记录了21只属于两种品种（缅因州库恩猫和欧洲短毛猫）的猫在不同情境下发出的喵声。这些情境包括：

刷毛 - 猫在家中被主人刷毛，持续时间不超过5分钟。
陌生环境隔离 - 猫被转移到不熟悉的环境中，旅程持续不超过30分钟，猫被允许与主人一起恢复30分钟后，单独留在不熟悉环境中，持续时间不超过5分钟。
等待食物 - 主人在猫熟悉的正常环境中开始准备喂食的操作，食物在实验开始后最多5分钟内提供。

文件命名规则

声音文件遵循以下命名模式：C_NNNNN_BB_SS_OOOOO_RXX，具体解释如下：

C = 发声情境（B = 刷毛；F = 等待食物；I = 陌生环境隔离）
NNNNN = 猫的唯一ID
BB = 品种（MC = 缅因州库恩猫；EU = 欧洲短毛猫）
SS = 性别（FI = 雌性，完整；FN = 雌性，绝育；MI = 雄性，完整；MN = 雄性，绝育）
OOOOO = 猫主人的唯一ID
R = 录音场次（1, 2 或 3）
XX = 发声计数（01..99）

额外内容

extra.zip 文件包含被排除的录音（非喵声的其他声音）和未剪辑的连续发声序列。

数据集来源

该数据集由米兰大学的研究人员收集，用于科学研究和非商业目的。

引用信息

在科学出版物中使用该数据集时，请引用以下参考文献：

Ntalampiras, S., Ludovico, L.A., Presti, G., Prato Previde, E., Battini, M., Cannas, S., Palestrini, C., Mattiello, S.: Automatic Classification of Cat Vocalizations Emitted in Different Contexts. Animals, vol. 9(8), pp. 543.1–543.14. MDPI (2019). ISSN: 2076-2615
Ludovico, L.A., Ntalampiras, S., Presti, G., Cannas, S., Battini, M., Mattiello, S.: CatMeows: A Publicly-Available Dataset of Cat Vocalizations. In: Li, X., Lokoč, J., Mezaris, V., Patras, I., Schoeffmann, K., Skopal, T., Vrochidis, S. (eds.) MultiMedia Modeling. 27th International Conference, MMM 2021, Prague, Czech Republic, June 22–24, 2021, Proceedings, Part II, LNCS, vol. 12573, pp. 230–243. Springer International Publishing, Cham (2021). ISBN: 978-3-030-67834-0 (print), 978-3-030-67835-7 (online) ISSN: 0302-9743 (print), 1611-3349 (online)

AI搜集汇总

数据集介绍

构建方式

CatMeows数据集的构建基于对21只不同品种（缅因州库恩猫和欧洲短毛猫）的猫在三种特定情境下的声音采集。这些情境包括刷牙、在陌生环境中隔离以及等待食物。每种情境下，猫的声音被记录并分类，确保数据的多样性和代表性。数据的采集过程严格遵守动物福利标准，尽量减少对猫的不适。

特点

该数据集包含440个猫叫声样本，每个样本都详细标注了猫的品种、性别、主人的唯一ID以及录音的具体情境。这种细致的标注为研究者提供了丰富的信息，使得数据集在动物行为学和声音识别领域具有高度的应用价值。此外，数据集还包含了被排除的录音和未剪辑的连续发声序列，增加了数据的完整性和研究深度。

使用方法

CatMeows数据集适用于科学研究和非商业用途。研究者可以通过分析不同情境下的猫叫声，探索猫的行为模式和情感表达。数据集的文件命名规则清晰，便于用户快速定位和分析特定条件下的声音样本。使用该数据集时，需按照要求引用相关文献，以尊重原作者的贡献。

背景与挑战

背景概述

CatMeows数据集由米兰大学的研究团队于2020年创建，旨在通过收集和分析猫在不同情境下的发声数据，推动动物行为学和声音识别领域的研究。该数据集包含了440个由21只猫（缅因州库恩猫和欧洲短毛猫）在不同刺激下发出的喵叫声，涵盖了刷牙、陌生环境隔离和等待食物三种情境。这些数据不仅为研究猫的行为模式提供了宝贵的资源，还为开发自动化的猫声分类系统奠定了基础。该数据集的研究成果已在多个国际会议上发表，并在动物行为学和多媒体建模领域产生了广泛影响。

当前挑战

CatMeows数据集在构建和应用过程中面临多重挑战。首先，猫的发声具有高度的多样性和复杂性，不同情境下的喵叫声可能表现出细微的差异，这对声音分类算法的设计提出了较高要求。其次，数据收集过程中需要确保猫的舒适度和安全性，尤其是在陌生环境隔离的情境下，如何减少猫的压力并保持数据的自然性是一个重要挑战。此外，数据标注和分类的准确性也依赖于对猫行为的深入理解，这对研究人员的专业知识提出了较高要求。最后，尽管数据集已公开，但其规模相对较小，可能限制了其在深度学习模型训练中的应用效果。

常用场景

经典使用场景

CatMeows数据集在动物行为学和声音识别领域具有广泛的应用。研究人员利用该数据集分析猫在不同情境下的发声模式，探索其情感表达和沟通方式。通过对比不同刺激下的喵声，研究者能够深入理解猫的行为反应和心理状态。

衍生相关工作

基于CatMeows数据集，研究者开发了多种自动分类算法，用于识别猫在不同情境下的发声。这些算法不仅应用于学术研究，还被整合到商业产品中，如宠物健康监测应用和智能家居系统，进一步推动了相关技术的发展和应用。

数据集最近研究

最新研究方向

近年来，随着人工智能和机器学习技术的飞速发展，CatMeows数据集在动物行为学和情感计算领域的研究中逐渐崭露头角。该数据集通过记录不同情境下猫咪的叫声，为研究者提供了丰富的声学数据，推动了基于声音的动物情感识别和行为分析的研究。特别是在多模态情感计算和智能宠物交互系统的开发中，CatMeows数据集的应用尤为广泛。研究者们利用该数据集训练深度学习模型，探索猫咪在不同情境下的情感表达模式，进而为宠物健康监测和情感交互提供科学依据。此外，该数据集还为跨物种情感识别和动物福利研究提供了新的视角，促进了人与动物之间更深层次的理解与互动。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像，每张图像均给出对应的人名，共有5749人，且绝大部分人仅有一张图片。每张图片的尺寸为250X250，绝大部分为彩色图像，但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源，是提供人类基本需求和基本社会保障的先决条件；也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础，兼具学术、经济、社会等多种价值。本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分（含胆固醇）数据，657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接： MP 2018.6.1（69,239 个材料） MP 2019.4.1（133,420 个材料）

OpenDataLab 收录

用于陆面模拟的中国土壤数据集（第二版）

本研究对中国范围内0-2米六个标准深度层（0-5、5-15、15-30、30-60、60-100和100-200厘米）的23种土壤物理和化学属性进行了90米空间分辨率的制图。该数据集源自第二次土壤普查的8979个土壤剖面，世界土壤信息服务的1540个土壤剖面，第一次全国土壤普查的76个土壤剖面，以及区域数据库的614个土壤剖面。该数据集包括pH值、砂粒、粉粒、粘粒、容重、有机碳含量、砾石、碱解氮、总氮、阳离子交换量、孔隙度、总钾、总磷、有效钾、有效磷和土壤颜色（包括蒙赛尔颜色和RGB两种形式）。数据集的缺失值为“fillvalue = -32768”。数据集以栅格格式提供，有Tiff和netCDF两种格式。为了满足陆面建模中不同应用对空间分辨率的不同要求，CSDLv2 提供了 90 米、1 公里和 10公里空间分辨率的版本。各个土壤属性的单位参见说明文档。该数据集相对于第一版具有更好的数据质量，可广泛应用于陆面过程模拟等地学相关研究。

国家青藏高原科学数据中心收录

China Groundgroundwater Monitoring Network

该数据集包含中国地下水监测网络的数据，涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标（如pH值、溶解氧、总硬度等）以及环境因素（如气温、降水量等）。