sakei/Bird_audio_in_China|鸟类声音分类数据集|生态研究数据集
收藏数据集概述
数据集名称
Bird_audio_in_China
数据集描述
本数据集收集了在中国境内的401种鸟种的叫声,适用于嵌入式AI应用的探索,如实时鸟种识别。数据集在生态研究、鸟类保护、生物多样性监测等领域具有重要意义。
数据来源
声音源来自xeno-canto.org,一个致力于分享来自世界各地的鸟声的网站。
数据集详细信息
- 分享者: sakei
- 协议: Apache-2.0
- 数据样本格式: .wav
- 大小: 51.4 GB (55,284,289,304字节)
- 包含文件数: 6,507个文件
- 部分鸟种文件格式: zip
数据样本格式
json { "物种的通用名称": { "sp": "物种的具体名称(绰号)", "ssp": "亚种名称(亚种加词)", "en": "物种的英文名称" } }
数据示例样本

CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Food-11
This is a dataset containing 16643 food images grouped in 11 major categories
kaggle 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
DermNet
DermNet是一个包含皮肤病图像的数据集,涵盖了多种皮肤病类型,如痤疮、湿疹、牛皮癣等。该数据集主要用于皮肤病诊断和研究。
www.dermnetnz.org 收录
rule34lol-images-part1
该数据集包含来自rule34.lol图像板的196,000个图像文件的元数据。元数据包括URL、标签、文件信息和点赞数。实际图像文件存储在zip存档中,每个存档包含1000个图像。该数据集是更大集合的一部分,分为Part 1和Part 2。数据集采用CC0许可,允许免费使用、修改和分发,无需署名。
huggingface 收录