Lindenthal Camera Traps Dataset|野生动物监测数据集|图像识别数据集
收藏Lindenthal Camera Traps Dataset - Instance Segmentation Annotations
数据集概述
- 版权信息: 版权所有 (c) 2023-2024 Antmicro
- 数据格式: 实例分割注释采用 COCO JSON 格式。
- 数据来源: 数据集来自 Lindenthal Camera Traps 数据集的一个子集。
- 数据内容: 包含 775 个视频记录,这些视频记录是在德国科隆的 Lindenthal Wildlife Park 使用 Intel RealSense D435 立体相机捕捉的。
注释信息
- 注释处理: 排除了每个视频的前 20 帧,以避免 Intel RealSense D435 立体相机的自动曝光调整的影响。从剩余帧中,每隔 10 帧进行注释。
- 注释内容:
- 实例掩码: 每个动物的像素级分割,用于精确形状定义。
- 边界框: 包围每个检测到的动物的矩形区域,适用于目标检测任务。
- 类别标签: 动物物种的具体标识。
许可证
- 注释文件: 注释文件为 annotations_lindenthal.json,采用 Apache-2.0 许可证。
- 视频记录: 视频记录可从 LILA 仓库 下载,并遵循网站上指定的许可条款。

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录