MetaWild
收藏Hugging Face2025-05-29 更新2025-05-30 收录
下载链接:
https://huggingface.co/datasets/lucas0927/MetaWild
下载链接
链接失效反馈官方服务:
资源简介:
MetaWild数据集是一个设计用于提高动物重识别(Animal ReID)的多模态基准,通过整合环境元数据和视觉数据。该数据集包含20,890张图片,涵盖六个代表性的动物种类,每张图片都附带身份标签和环境元数据,如温度、昼夜节律、拍照时间等,为区分个体动物提供了宝贵的信息。数据集来源于公开的NZ-TrailCams库,遵循社区数据许可协议。
The MetaWild dataset is a multimodal benchmark designed to advance animal reidentification (Animal ReID) by integrating environmental metadata and visual data. It contains 20,890 images covering six representative animal species, with each image accompanied by identity labels and environmental metadata including temperature, circadian rhythm, and capture time, providing valuable information for distinguishing individual animals. The dataset is sourced from the publicly available NZ-TrailCams repository and complies with the community data license agreement.
创建时间:
2025-05-28
原始信息汇总
MetaWild数据集概述
数据集基本信息
- 许可证: CDLA-Permissive-1.0
- 标签: 生物学、动物重识别
- 数据格式: 结构化
.json文件 - 数据来源: 新西兰野外
数据集内容
- 总图像数: 20,890张
- 覆盖物种: 6种
- Deer(鹿)
- Hare(野兔)
- Penguin(企鹅)
- Stoat(白鼬)
- Wallaby(沙袋鼠)
- Pūkeko(紫水鸡)
数据组织
- 按物种划分配置:
- 每个物种包含三个分割:
train: 训练集query: 查询集gallery: 图库集
- 文件路径示例:
deer/deer_train.txt
- 每个物种包含三个分割:
数据特征
- 每张图像包含:
- 个体动物ID标签
- 环境元数据:
face_direction: 面部朝向(0:前, 1:后, 2:左, 3:右)temperature: 摄氏温度值circadian rhythms: 昼夜节律(日/夜)timestamp: 图像捕获时间
物种选择依据
- 生态多样性:
- 入侵物种(Stoat)
- 濒危本地物种(Yellow-eyed Penguin)
- 农业害虫(Wallaby, Hare)
- 行为多样的本地物种(Deer, Pūkeko)
数据集构建原则
- 生态多样性
- 图像质量筛选
- 元数据完整性
- 最小样本量保证(每物种≥2,000张图像)
许可与访问
- 基础数据集: NZ-TrailCams
- 访问方式:
- 仅提供元数据JSON文件
- 原始图像需通过文件名匹配从NZ-TrailCams获取
可视化资源
- 温度分布
- 昼夜节律分布
- 面部朝向分布
相关资源
搜集汇总
数据集介绍

构建方式
MetaWild数据集的构建基于对新西兰野外常见六种动物的高质量图像及其环境元数据的综合。通过精心筛选物种,确保图像质量,以及元数据的完整性与可用性,该数据集汇集了20890张图像,每张图像均伴有个体身份标签及温度、昼夜节律等环境信息。数据来源于公共的NZ-TrailCams库,经过筛选和处理,形成结构化的.json文件。
特点
该数据集的特色在于整合了视觉数据与环境元数据,为动物重识别研究提供了新的视角。涵盖了入侵物种与本地物种,以及不同的生态角色和保育优先级,使得MetaWild数据集不仅具有生态多样性,而且对于野生动物监测应用具有实际意义。数据集的构建原则确保了高质量的个体识别模型训练。
使用方法
使用MetaWild数据集时,用户可以直接访问其提供的.json文件,其中包含了图像的元数据和文件名。若需要原始图像,用户可前往NZ-TrailCams库,利用.json文件中的物种名、相机ID和帧计数索引来检索特定的样本。这种方式既保证了数据的可重复性,也尊重了原始数据的所有权和存储限制。
背景与挑战
背景概述
MetaWild数据集,作为一项创新的动物重识别研究资源,是在新西兰野外环境中常见动物的研究背景下构建的。该数据集的创建汇集了来自不同学科的研究人员,旨在通过整合环境元数据和视觉数据,提升动物重识别技术的准确性和实用性。自构建以来,MetaWild数据集包含了20,890张图片,跨越六大代表性物种,其独特的元数据配对策略为动物个体识别提供了丰富的环境上下文信息,对野生动物监测和保护领域产生了显著影响。
当前挑战
MetaWild数据集面临的挑战主要在于两个方面:一是动物重识别领域内的问题,例如如何在包含环境干扰和个体差异的情况下准确识别动物个体;二是数据集构建过程中的挑战,包括如何确保图像的高质量、元数据的准确性和代表性,以及如何在尊重原始数据版权的同时提供便捷的数据访问方式。这些挑战不仅要求研究者在算法设计上进行创新,也考验着数据集构建过程中的数据处理和整合能力。
常用场景
经典使用场景
在动物重新识别研究领域,MetaWild数据集以其独特的多模态特性,即结合视觉数据与环境元数据,成为了一个经典的使用案例。该数据集通过提供包含个体身份标签和环境信息的图像,使得研究人员能够更加精确地识别和区分个体动物。
实际应用
在实际应用中,MetaWild数据集可用于野生动物监测、生态研究、物种保护等多个领域。其丰富的元数据为研究人员提供了深入分析动物行为和生态习性所需的详细信息,对于制定生态保护和物种管理策略具有重要意义。
衍生相关工作
MetaWild数据集的推出促进了相关领域的研究进展,衍生出了一系列经典工作。这些研究不仅涉及动物识别技术的改进,还包括基于该数据集的生态模型构建、动物行为分析等,为野生动物研究提供了新的视角和方法论。
以上内容由遇见数据集搜集并总结生成



