five

Francesco/thermal-dogs-and-people-x6ejw

收藏
Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Francesco/thermal-dogs-and-people-x6ejw
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image_id dtype: int64 - name: image dtype: image - name: width dtype: int32 - name: height dtype: int32 - name: objects sequence: - name: id dtype: int64 - name: area dtype: int64 - name: bbox sequence: float32 length: 4 - name: category dtype: class_label: names: '0': thermal-dogs-n-people '1': dog '2': person annotations_creators: - crowdsourced language_creators: - found language: - en license: - cc multilinguality: - monolingual size_categories: - 1K<n<10K source_datasets: - original task_categories: - object-detection task_ids: [] pretty_name: thermal-dogs-and-people-x6ejw tags: - rf100 --- # Dataset Card for thermal-dogs-and-people-x6ejw ** The original COCO dataset is stored at `dataset.tar.gz`** ## Dataset Description - **Homepage:** https://universe.roboflow.com/object-detection/thermal-dogs-and-people-x6ejw - **Point of Contact:** francesco.zuppichini@gmail.com ### Dataset Summary thermal-dogs-and-people-x6ejw ### Supported Tasks and Leaderboards - `object-detection`: The dataset can be used to train a model for Object Detection. ### Languages English ## Dataset Structure ### Data Instances A data point comprises an image and its object annotations. ``` { 'image_id': 15, 'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>, 'width': 964043, 'height': 640, 'objects': { 'id': [114, 115, 116, 117], 'area': [3796, 1596, 152768, 81002], 'bbox': [ [302.0, 109.0, 73.0, 52.0], [810.0, 100.0, 57.0, 28.0], [160.0, 31.0, 248.0, 616.0], [741.0, 68.0, 202.0, 401.0] ], 'category': [4, 4, 0, 0] } } ``` ### Data Fields - `image`: the image id - `image`: `PIL.Image.Image` object containing the image. Note that when accessing the image column: `dataset[0]["image"]` the image file is automatically decoded. Decoding of a large number of image files might take a significant amount of time. Thus it is important to first query the sample index before the `"image"` column, *i.e.* `dataset[0]["image"]` should **always** be preferred over `dataset["image"][0]` - `width`: the image width - `height`: the image height - `objects`: a dictionary containing bounding box metadata for the objects present on the image - `id`: the annotation id - `area`: the area of the bounding box - `bbox`: the object's bounding box (in the [coco](https://albumentations.ai/docs/getting_started/bounding_boxes_augmentation/#coco) format) - `category`: the object's category. #### Who are the annotators? Annotators are Roboflow users ## Additional Information ### Licensing Information See original homepage https://universe.roboflow.com/object-detection/thermal-dogs-and-people-x6ejw ### Citation Information ``` @misc{ thermal-dogs-and-people-x6ejw, title = { thermal dogs and people x6ejw Dataset }, type = { Open Source Dataset }, author = { Roboflow 100 }, howpublished = { \url{ https://universe.roboflow.com/object-detection/thermal-dogs-and-people-x6ejw } }, url = { https://universe.roboflow.com/object-detection/thermal-dogs-and-people-x6ejw }, journal = { Roboflow Universe }, publisher = { Roboflow }, year = { 2022 }, month = { nov }, note = { visited on 2023-03-29 }, }" ``` ### Contributions Thanks to [@mariosasko](https://github.com/mariosasko) for adding this dataset.

数据集信息: 特征: - 名称:image_id(图像ID),数据类型:int64(64位整数) - 名称:image(图像),数据类型:image(图像) - 名称:width(图像宽度),数据类型:int32(32位整数) - 名称:height(图像高度),数据类型:int32(32位整数) - 名称:objects(目标对象),序列类型: - 名称:id(标注ID),数据类型:int64 - 名称:area(边界框面积),数据类型:int64 - 名称:bbox(边界框),序列类型:float32(单精度浮点数),长度为4 - 名称:category(类别),数据类型: 类别标签: 名称映射: '0': 热成像犬与人(thermal-dogs-n-people) '1': 狗(dog) '2': 人(person) annotations_creators: 众包(crowdsourced) language_creators: 公开采集(found) language: 英语(en) license: 知识共享许可(cc) multilinguality: 单语言(monolingual) size_categories: 样本量介于1000至10000之间(1K<n<10K) source_datasets: 原始数据集(original) task_categories: 目标检测(object-detection) task_ids: 无 pretty_name: thermal-dogs-and-people-x6ejw(热成像犬与人-x6ejw) tags: Roboflow 100(rf100) # 数据集卡片:thermal-dogs-and-people-x6ejw(热成像犬与人-x6ejw) **原始COCO数据集存储于`dataset.tar.gz`** ## 数据集说明 - **主页链接**:https://universe.roboflow.com/object-detection/thermal-dogs-and-people-x6ejw - **联系人**:francesco.zuppichini@gmail.com ### 数据集概述 thermal-dogs-and-people-x6ejw(热成像犬与人-x6ejw) ### 支持任务与基准排行榜 - `目标检测(object-detection)`:本数据集可用于训练目标检测模型。 ### 使用语言 英语 ## 数据集结构 ### 数据实例 单个数据样本包含一幅图像及其目标标注信息。 { 'image_id': 15, 'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x2373B065C18>, 'width': 964043, 'height': 640, 'objects': { 'id': [114, 115, 116, 117], 'area': [3796, 1596, 152768, 81002], 'bbox': [ [302.0, 109.0, 73.0, 52.0], [810.0, 100.0, 57.0, 28.0], [160.0, 31.0, 248.0, 616.0], [741.0, 68.0, 202.0, 401.0] ], 'category': [4, 4, 0, 0] } } ### 数据字段说明 - `image_id`:图像唯一标识符 - `image`:包含图像的`PIL.Image.Image`(Python图像库图像对象)。请注意,当访问图像列时:`dataset[0]["image"]`会自动对图像文件进行解码。解码大量图像文件可能会耗费大量时间,因此建议优先通过样本索引查询图像列,即**始终优先使用`dataset[0]["image"]`而非`dataset["image"][0]`** - `width`:图像宽度 - `height`:图像高度 - `objects`:包含图像中目标对象的边界框元数据的字典 - `id`:标注编号 - `area`:边界框的像素面积 - `bbox`:目标的边界框,格式遵循COCO标准 - `category`:目标的类别标签。 #### 标注人员信息 标注人员为Roboflow平台用户 ## 补充信息 ### 许可信息 详见官方主页:https://universe.roboflow.com/object-detection/thermal-dogs-and-people-x6ejw ### 引用信息 @misc{ thermal-dogs-and-people-x6ejw, title = { thermal dogs and people x6ejw 数据集 }, type = { 开源数据集 }, author = { Roboflow 100 }, howpublished = { url{ https://universe.roboflow.com/object-detection/thermal-dogs-and-people-x6ejw } }, url = { https://universe.roboflow.com/object-detection/thermal-dogs-and-people-x6ejw }, journal = { Roboflow 宇宙平台 }, publisher = { Roboflow }, year = { 2022 }, month = { 11月 }, note = { 2023年3月29日访问 }, } ### 贡献致谢 感谢[@mariosasko](https://github.com/mariosasko)为本数据集提供的录入支持。
提供机构:
Francesco
原始信息汇总

数据集概述

数据集名称

thermal-dogs-and-people-x6ejw

数据集特征

  • image_id: 整数类型 (int64)
  • image: 图像类型
  • width: 整数类型 (int32)
  • height: 整数类型 (int32)
  • objects: 序列类型,包含以下子特征:
    • id: 整数类型 (int64)
    • area: 整数类型 (int64)
    • bbox: 序列类型,长度为4,浮点数类型 (float32)
    • category: 类别标签,包含以下名称:
      • 0: thermal-dogs-n-people
      • 1: dog
      • 2: person

数据集结构

  • 数据实例: 每个数据点包含一张图片及其对象标注。
  • 数据字段:
    • image: 图片对象
    • width: 图片宽度
    • height: 图片高度
    • objects: 包含对象的元数据,如ID、面积、边界框和类别。

数据集用途

  • 任务类别: 对象检测
  • 支持的任务: 用于训练对象检测模型

数据集详情

  • 语言: 英语
  • 许可证: cc
  • 多语言性: 单语种
  • 大小类别: 1K<n<10K
  • 源数据集: 原始数据
  • 标签: rf100

注释者

  • 注释者为Roboflow用户
搜集汇总
数据集介绍
main_image_url
构建方式
在热成像目标检测领域,数据集的构建需兼顾真实场景与标注精度。本数据集源自Roboflow平台,通过众包方式采集并标注热成像图像,涵盖狗与人两类目标。原始数据以COCO格式存储,每张图像均附带边界框标注,标注过程由平台用户协作完成,确保了数据的多样性与实用性。构建过程中,图像尺寸统一为640x640像素,便于模型训练与评估,体现了标准化处理在数据工程中的重要性。
特点
本数据集以热成像技术为核心,突出其在低光照或复杂环境下的目标检测优势。数据规模介于1K至10K之间,包含丰富的实例标注,每个对象均提供边界框、面积及类别信息,类别涵盖“狗”与“人”两类,支持细粒度分析。图像格式为RGB模式,虽为热成像数据,但经过处理适配常规视觉模型,同时标注遵循COCO标准,便于与现有检测框架无缝集成,增强了数据集的通用性与可扩展性。
使用方法
针对目标检测任务,本数据集可直接用于训练与评估深度学习模型。使用者可通过HuggingFace平台加载数据,访问时需注意图像解码顺序,优先索引样本再调用图像列以提升效率。数据字段包括图像ID、尺寸及对象字典,其中边界框采用COCO格式,需结合相应库进行解析。应用场景聚焦于热成像环境下的目标识别,如安防监控或野生动物研究,建议结合数据增强技术以提升模型鲁棒性,充分发挥热成像数据的独特价值。
背景与挑战
背景概述
在计算机视觉领域,热成像技术因其在低光照或复杂环境下的独特优势而备受关注。Francesco/thermal-dogs-and-people-x6ejw数据集于2022年由Roboflow 100团队构建,专注于热成像图像中的目标检测任务。该数据集的核心研究问题在于提升热成像场景下对狗和人的精准识别能力,以支持安防监控、野生动物保护及搜救行动等实际应用。通过提供标注精细的热成像样本,该数据集为热视觉分析领域注入了新的研究动力,推动了跨模态感知技术的发展。
当前挑战
该数据集旨在应对热成像目标检测中的关键挑战,包括热信号与可见光图像的模态差异导致的特征提取困难,以及目标在热成像中因温度变化而呈现的轮廓模糊问题。在构建过程中,挑战主要源于热成像数据的稀缺性,使得数据采集与标注成本较高;同时,标注过程需依赖专业领域知识以确保边界框与类别标注的准确性,而众包标注方式可能引入一致性偏差,需通过严格的质量控制机制来保障数据可靠性。
常用场景
经典使用场景
在红外热成像技术日益普及的背景下,thermal-dogs-and-people-x6ejw数据集为计算机视觉领域提供了宝贵的资源。该数据集专为对象检测任务设计,其经典使用场景集中在训练和评估模型对热成像图像中狗和人的识别能力。通过标注的边界框和类别信息,研究者能够构建精准的检测算法,以应对复杂环境下的目标定位挑战,例如在低光照或恶劣天气条件下,传统视觉系统往往失效,而热成像数据则展现出独特优势。
解决学术问题
该数据集有效解决了红外热成像领域中目标检测的若干核心学术问题。首先,它填补了热成像数据集中狗和人类别标注的空白,为研究跨物种目标识别提供了标准化基准。其次,数据集支持模型在非可见光谱下的泛化能力研究,促进了多模态视觉系统的发展。通过解决这些难题,该数据集推动了红外视觉算法的进步,为学术探索提供了可靠的数据支撑,增强了模型在现实场景中的鲁棒性和准确性。
衍生相关工作
该数据集衍生了一系列经典研究工作,主要集中在红外目标检测算法的优化与创新。例如,研究者利用该数据集开发了基于深度学习的端到端检测框架,如改进的YOLO或Faster R-CNN变体,这些模型在热成像数据上实现了更高的检测精度和速度。同时,一些工作探索了数据增强和迁移学习策略,以克服热成像数据量有限的挑战。这些衍生成果不仅丰富了红外视觉的文献体系,还为后续研究提供了可复现的基准,推动了整个领域的协同发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作