CatMeows|猫行为研究数据集|声音分析数据集
收藏CatMeows 数据集概述
数据集简介
CatMeows 数据集包含440个声音文件,记录了21只属于两种品种(缅因州库恩猫和欧洲短毛猫)的猫在不同情境下发出的喵声。这些情境包括:
- 刷毛 - 猫在家中被主人刷毛,持续时间不超过5分钟。
- 陌生环境隔离 - 猫被转移到不熟悉的环境中,旅程持续不超过30分钟,猫被允许与主人一起恢复30分钟后,单独留在不熟悉环境中,持续时间不超过5分钟。
- 等待食物 - 主人在猫熟悉的正常环境中开始准备喂食的操作,食物在实验开始后最多5分钟内提供。
文件命名规则
声音文件遵循以下命名模式:C_NNNNN_BB_SS_OOOOO_RXX
,具体解释如下:
C
= 发声情境(B
= 刷毛;F
= 等待食物;I
= 陌生环境隔离)NNNNN
= 猫的唯一IDBB
= 品种(MC
= 缅因州库恩猫;EU
= 欧洲短毛猫)SS
= 性别(FI
= 雌性,完整;FN
= 雌性,绝育;MI
= 雄性,完整;MN
= 雄性,绝育)OOOOO
= 猫主人的唯一IDR
= 录音场次(1, 2 或 3)XX
= 发声计数(01..99)
额外内容
extra.zip
文件包含被排除的录音(非喵声的其他声音)和未剪辑的连续发声序列。
数据集来源
该数据集由米兰大学的研究人员收集,用于科学研究和非商业目的。
引用信息
在科学出版物中使用该数据集时,请引用以下参考文献:
- Ntalampiras, S., Ludovico, L.A., Presti, G., Prato Previde, E., Battini, M., Cannas, S., Palestrini, C., Mattiello, S.: Automatic Classification of Cat Vocalizations Emitted in Different Contexts. Animals, vol. 9(8), pp. 543.1–543.14. MDPI (2019). ISSN: 2076-2615
- Ludovico, L.A., Ntalampiras, S., Presti, G., Cannas, S., Battini, M., Mattiello, S.: CatMeows: A Publicly-Available Dataset of Cat Vocalizations. In: Li, X., Lokoč, J., Mezaris, V., Patras, I., Schoeffmann, K., Skopal, T., Vrochidis, S. (eds.) MultiMedia Modeling. 27th International Conference, MMM 2021, Prague, Czech Republic, June 22–24, 2021, Proceedings, Part II, LNCS, vol. 12573, pp. 230–243. Springer International Publishing, Cham (2021). ISBN: 978-3-030-67834-0 (print), 978-3-030-67835-7 (online) ISSN: 0302-9743 (print), 1611-3349 (online)

金庸语料库
从金庸15部小说中收集了1373个人名、292个地名、384个武功名称、119种武器名称、97个门派名称。
github 收录
Pubmed
Pubmed 数据集包含来自 PubMed 数据库的 19717 篇与糖尿病相关的科学出版物,分为三类之一。引文网络由 44338 个链接组成。数据集中的每个出版物都由字典中的 TF/IDF 加权词向量描述,该字典由 500 个唯一词组成。
OpenDataLab 收录
UniMed
UniMed是一个大规模、开源的多模态医学数据集,包含超过530万张图像-文本对,涵盖六种不同的医学成像模态:X射线、CT、MRI、超声、病理学和眼底。该数据集通过利用大型语言模型(LLMs)将特定模态的分类数据集转换为图像-文本格式,并结合现有的医学领域的图像-文本数据,以促进可扩展的视觉语言模型(VLM)预训练。
github 收录
CCNC
CCNC是一个包含365万姓名样本的大型中文姓名语料库,数据来源于姓名大全和中文人名语料库,经过处理和注音,用于中文姓名研究和实体识别。
github 收录
SHHS Sleep Heart Health Study Dataset
SHHS(Sleep Heart Health Study)数据集是一个大型多中心研究项目,旨在研究睡眠障碍与心血管疾病之间的关系。数据集包括了参与者的睡眠记录、心血管健康指标、生活习惯、遗传信息等多方面的数据。
sleepdata.org 收录