five

ridgerun-ai/citw-v0.1

收藏
Hugging Face2024-01-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ridgerun-ai/citw-v0.1
下载链接
链接失效反馈
官方服务:
资源简介:
CITW(Cellphones in the Wild)是一个包含手机图像及其对应边界框注释的小型数据集。该数据集是从COCO 2017数据集中提取的,仅保留了包含手机的图像和注释。数据集由Michael Grüner策划,并由RidgeRun.ai资助,采用CC-BY-NC-2.0许可证。数据集包含两个分割:train和val,每个分割中包含JPEG格式的图像和metadata.jsonl文件。metadata.jsonl文件中的每个条目代表一张图像,包含边界框和类别信息。数据集主要用于训练手机检测器,但仅限于2017年之前生产的手机模型,可能会与其他类似设备混淆。

CITW(Cellphones in the Wild)是一个包含手机图像及其对应边界框注释的小型数据集。该数据集是从COCO 2017数据集中提取的,仅保留了包含手机的图像和注释。数据集由Michael Grüner策划,并由RidgeRun.ai资助,采用CC-BY-NC-2.0许可证。数据集包含两个分割:train和val,每个分割中包含JPEG格式的图像和metadata.jsonl文件。metadata.jsonl文件中的每个条目代表一张图像,包含边界框和类别信息。数据集主要用于训练手机检测器,但仅限于2017年之前生产的手机模型,可能会与其他类似设备混淆。
提供机构:
ridgerun-ai
原始信息汇总

数据集卡片:Cellphones in the Wild

数据集详情

数据集描述

CITW(Cellphones in the Wild)是一个包含图像中手机边界框标注的小型数据集。该数据集是从COCO 2017中提取的,仅保留了包含手机的图像及其对应的边界框标注。数据集的结构和标注已调整为与Huggingface兼容。

  • 许可证: CC-BY-NC-2.0

数据集来源

用途

直接用途

CITW旨在用于训练手机检测器。

超出范围的用途

该数据集仅包含手机样本,不适用于其他类型的电话,如办公室电话、传真机或公共电话。

数据集结构

数据集位于data目录下,包含两个拆分:trainval,分别表示为子目录。每个拆分中包含JPEG格式的图像以及一个metadata.jsonl文件。

metadata.jsonl文件每行一个条目,每个条目代表一个图像。标注信息可以在objects对象下找到。该对象包含一个边界框列表(本身是一个列表)和一个类别列表(只有一个类别:0)。

单个边界框标注为:[x, y, width, height]

只有一个类别:0,显然对应于手机类别。

条目示例

一个条目示例如下: json { "file_name": "000000253967.jpg", "objects": { "bbox": [ [16.31, 104.46, 33.54, 43.17], [277.55, 146.1, 17.99, 58.69], [436.56, 130.99, 23.33, 42.09] ], "categories": [0, 0, 0] } }

在这个示例中,图像包含3个手机,这反映在3个边界框和3个手机类别列表中。

数据集创建

源数据

数据收集和处理

该数据集是COCO2017的精简版。仓库中包含一个coco2citw.py脚本,用于自动化此过程。

源数据生产者

有关原始生产过程的信息,请参阅COCO Challenge主页

个人和敏感信息

据我们所知,该数据集中没有个人和敏感信息。

偏差、风险和限制

该数据集仅限于2017年之前生产的手机型号。类似物体(如对讲机、便携式游戏机或计算器)可能会被混淆。

术语表

CITW: Cellphones in the Wild

搜集汇总
数据集介绍
main_image_url
构建方式
Cellphones in the Wild (CITW)数据集,是由Michael Grüner精心策划,从COCO 2017数据集中提炼而来。该数据集仅保留了包含手机及其边界框注释的图像。通过自动化脚本coco2citw.py,将原始COCO数据集中的结构和注释转换为Huggingface兼容的格式,确保了数据集构建的准确性和效率。
特点
CITW数据集的主要特点在于其专注于野外环境下手机图像的检测。数据集规模虽小,但结构紧凑,仅包含手机相关样本,且所有图像均伴有精确的边界框注释。其遵循CC-BY-NC-2.0许可,保证了数据集在非商业用途下的开放性和可用性。
使用方法
使用CITW数据集,用户可以直接用于训练手机检测模型。数据集分为训练集和验证集两个部分,每个部分都包含JPEG格式的图像和metadata.jsonl文件。用户可以依据metadata.jsonl文件中提供的边界框信息,对模型进行监督学习训练,进而提高手机检测的准确性。
背景与挑战
背景概述
在智能视觉识别领域,Cellphones in the Wild(CITW)数据集的构建旨在推动移动设备检测技术的发展。该数据集由RidgeRun.ai资助,并于2017年基于COCO数据集进行精炼,专注于提取包含手机图像及其边界框注释的样本。其主要研究人员为Michael Grüner,此数据集的创建不仅丰富了移动设备识别领域的研究资源,而且对提升现实场景中手机检测算法的准确性具有显著影响。
当前挑战
CITW数据集在构建和应用过程中面临的挑战主要包括:一是数据集的局限性,仅涵盖2017年及以前生产的手机模型,可能无法适应新型手机的变化;二是数据集的泛化能力,由于仅包含手机样本,对于类似设备如对讲机、便携式游戏机等识别存在混淆风险;三是数据集的多样性和广泛性不足,可能无法全面覆盖现实世界中的手机使用场景,从而影响检测算法的泛化表现。
常用场景
经典使用场景
在计算机视觉研究领域,Cellphones in the Wild (CITW) 数据集以其精妙的构造和详尽的标注,成为对象检测任务中训练 cellphone 检测器的直接用例。该数据集通过从 COCO 2017 中提炼出含手机图像及其边界框标注的样本,为研究者提供了一个专注于手机检测的基准。
解决学术问题
CITW 数据集解决了对象检测领域中对特定对象,即手机,进行准确识别与定位的学术难题。它为算法训练提供了一个针对性的数据源,有助于提升检测模型在复杂环境下的鲁棒性和准确性,对于推动相关学术研究的深入发展具有显著意义。
衍生相关工作
基于 CITW 数据集的研究成果,已经衍生出一系列相关的工作,包括但不限于对检测算法的改进、数据集的扩展以及跨领域应用的探索,这些研究进一步拓宽了计算机视觉技术在现实世界的应用范围,并对未来技术的发展产生了深远影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作