five

Animal Kingdom|动物行为分析数据集|视频分析数据集

收藏
arXiv2022-06-03 更新2024-06-21 收录
动物行为分析
视频分析
下载链接:
https://sutdcv.github.io/Animal-Kingdom
下载链接
链接失效反馈
资源简介:
Animal Kingdom数据集由新加坡科技设计大学信息系统技术与设计学院创建,包含超过850种动物的50小时视频,用于视频定位、动作识别和姿态估计。数据集涵盖多种环境条件和视角,包括不同背景、光照和天气条件。创建过程中,通过23名成员包括生物学专家的共同努力,进行了细致的帧级标注和三轮质量检查。该数据集旨在促进动物行为分析的研究,特别是在野生动物保护和生态研究领域。
提供机构:
新加坡科技设计大学信息系统技术与设计学院
创建时间:
2022-04-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
在动物行为理解领域,现有的数据集在动物类别数量、数据样本多样性以及任务类型等方面存在显著局限。为应对这些挑战,我们构建了名为Animal Kingdom的大型多样化数据集。该数据集通过从YouTube收集的50小时野生动物视频,涵盖了多种环境条件和视角变化。具体而言,数据集包括用于视频定位任务的50小时标注视频,用于细粒度多标签动作识别任务的30K视频序列,以及用于姿态估计任务的33K帧图像。这些数据对应于6大类动物中的850个物种,旨在为动物行为分析提供一个全面且具有挑战性的基准。
特点
Animal Kingdom数据集的显著特点在于其广泛性和多样性。首先,数据集包含了850个物种,跨越6大类动物,涵盖了从哺乳动物到昆虫的广泛类别。其次,视频数据在不同的时间段、光照条件和天气条件下采集,反映了自然环境中动物行为的复杂性。此外,数据集提供了多任务标注,包括视频定位、动作识别和姿态估计,为研究者提供了丰富的数据资源以开发和评估先进的动物行为分析方法。
使用方法
Animal Kingdom数据集适用于多种动物行为分析任务。对于视频定位任务,研究者可以使用自然语言描述来检索相关视频片段;对于动作识别任务,数据集提供了细粒度的多标签动作标注,支持开发能够识别复杂动物行为的模型;对于姿态估计任务,数据集包含了多种动物类别的姿态标注,有助于研究者开发适用于不同动物的姿态估计方法。此外,数据集的多样性和复杂性为开发具有广泛适用性的模型提供了理想的测试平台。
背景与挑战
背景概述
动物行为理解在多个应用领域中具有重要意义,然而现有数据集在动物类别数量、数据样本、任务多样性以及环境条件和视角变化方面存在局限性。为解决这些局限性,我们创建了名为Animal Kingdom的大型多样化数据集,提供了多个注释任务,以促进对自然动物行为的更深入理解。该数据集包含50小时注释视频,用于视频定位任务,30K视频序列用于细粒度多标签动作识别任务,以及33K帧用于姿态估计任务,涵盖6大类动物的850个物种。这一具有挑战性和全面性的数据集将有助于社区开发、适应和评估各种先进的动物行为分析方法。
当前挑战
Animal Kingdom数据集在构建过程中面临多项挑战。首先,解决领域问题如图像分类的挑战,需要处理动物行为的多样性和复杂性。其次,构建过程中遇到的挑战包括数据样本的稀缺性、动物类别和环境条件的有限多样性,以及任务和注释的不足。此外,动物在野外的自然行为通常是动态、复杂和嘈杂的,这增加了数据集的复杂性和分析难度。最后,数据集的多标签动作和长尾分布特性为模型的准确性和鲁棒性提出了更高的要求。
常用场景
经典使用场景
Animal Kingdom数据集的经典使用场景在于其广泛应用于动物行为理解的研究中。该数据集提供了丰富的视频片段和多任务注释,包括视频定位、细粒度多标签动作识别和姿态估计,使得研究人员能够深入分析野生动物的自然行为。通过这些任务,研究者可以识别和提取视频中相关的动物行为片段,进行动作识别和姿态估计,从而全面理解动物的行为模式。
实际应用
Animal Kingdom数据集在实际应用中具有广泛的前景,特别是在野生动物监测和保护领域。通过视频定位技术,研究人员可以高效地从长视频中提取感兴趣的动物行为片段,减少人工筛选的工作量。动作识别和姿态估计则有助于监测动物的健康状况和行为变化,为野生动物管理和保护提供科学依据。此外,该数据集还可用于生物启发机器人设计和动画渲染等领域。
衍生相关工作
Animal Kingdom数据集的发布催生了一系列相关研究工作。例如,研究者提出了Collaborative Action Recognition (CARe)模型,该模型能够识别未见过的动物类型的动作,通过学习通用和特定特征来提高动作识别的性能。此外,该数据集还促进了视频定位、动作识别和姿态估计等领域的算法改进和创新,推动了动物行为分析技术的进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

Med-MAT

Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。

huggingface 收录

中国陆域及周边逐日1km全天候地表温度数据集(TRIMS LST;2000-2023)

地表温度(Land surface temperature, LST)是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现,又对于地气过程具有复杂的反馈作用。因此,地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提,还是众多模型的直接输入参数,在许多领域有广泛的应用,如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化,学术界对卫星遥感的全天候地表温度(All-weather LST)具有迫切的需求。 本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据,辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性,最终重建得到较高质量的全天候地表温度数据集。 评价结果表明,本数据集具有良好的图像质量和精度,不仅在空间上无缝,还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时,该数据集在白天和夜间的平均偏差(MBE)为0.09K和-0.03K,偏差标准差(STD)为1.45K和1.17K。基于19个站点实测数据的检验结果表明,其MBE为-2.26K至1.73K,RMSE为0.80K至3.68K,且在晴空与非晴空条件下无显著区别。 本数据集的时间分辨率为逐日4次,空间分辨率为1km,时间跨度为2000年-2023年;空间范围包括我国陆域的主要区域(包含港澳台地区,暂不包含我国南海诸岛)及周边区域(72°E-135°E,19°N-55°N)。本数据集的缩写名为TRIMS LST(Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST),以便用户使用。需要说明的是,TRIMS LST的空间子集TRIMS LST-TP(中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2023)V2)同步在国家青藏高原科学数据中心发布,以减少相关用户数据下载和处理的工作量。

国家青藏高原科学数据中心 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录

CHFS中国家庭金融调查数据

  中国家庭金融调查(China Household Finance Survey, CHFS)是中国家庭金融调查与研究中心(以下简称“中心”)在全国范围内开展的抽样调查项目,旨在收集有关家庭金融微观层次的相关信息,主要内容包括:人口特征与就业、资产与负债、收入与消费、社会保障与保险以及主观态度等相关信息,对家庭经济、金融行为进行了全面细致刻画。  CHFS基线调查始于2011年,目前已分别在2011、2013、2015、2017和2019年成功实施五轮全国范围内的抽样调查项目,2021年第六轮调查还在进行中。CHFS最新公开的2019年第五轮调查数据,样本覆盖全国29个省(自治区、直辖市),343个区县,1360个村(居)委会,样本规模达34643户,数据具有全国及省级代表性。

CnOpenData 收录