five

CrowdHuman|计算机视觉数据集|人体检测数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
计算机视觉
人体检测
下载链接:
https://opendatalab.org.cn/OpenDataLab/CrowdHuman
下载链接
链接失效反馈
资源简介:
CrowdHuman 是一个基准数据集,可以更好地评估人群场景中的检测器。 CrowdHuman 数据集很大,注释丰富并且包含高度的多样性。 CrowdHuman 包含 15000、4370 和 5000 张图像,分别用于训练、验证和测试。训练和验证子集中共有 470K 人类实例,每张图像有 23 个人,数据集中有各种遮挡。每个人体实例都用头部边界框、人体可见区域边界框和人体全身边界框进行注释。我们希望我们的数据集将作为一个坚实的基线,并有助于促进人类检测任务的未来研究。
提供机构:
OpenDataLab
创建时间:
2022-03-17
AI搜集汇总
数据集介绍
main_image_url
构建方式
CrowdHuman数据集的构建基于大规模的真实世界图像,涵盖了多种复杂场景,包括拥挤的街道、市场和公共交通枢纽。数据集通过精心设计的标注流程,确保了高精度的边界框标注,每个对象都配备了头部和全身的标注信息。此外,数据集还包含了遮挡和部分可见对象的详细标注,以增强其在实际应用中的鲁棒性。
特点
CrowdHuman数据集以其高密度和多样性著称,包含了超过150,000个标注对象,分布在47,000多张图像中。其独特之处在于对头部和全身的详细标注,这使得数据集在行人检测和人群分析任务中表现卓越。此外,数据集还特别关注了遮挡和部分可见对象的处理,提供了丰富的遮挡情况下的标注数据,从而提升了模型的泛化能力。
使用方法
CrowdHuman数据集适用于多种计算机视觉任务,特别是行人检测和人群分析。研究人员和开发者可以利用该数据集训练和评估模型,以提高在复杂和拥挤场景中的检测精度。数据集的标注信息可以直接用于监督学习,也可以通过数据增强技术进一步提升模型的性能。此外,CrowdHuman还提供了详细的评估指标和工具,方便用户进行性能分析和比较。
背景与挑战
背景概述
CrowdHuman数据集由ShanghaiTech、Microsoft Research Asia和SenseTime联合创建,旨在解决大规模人群场景中的行人检测问题。该数据集于2018年发布,包含了超过150万个人体实例,覆盖了各种复杂的城市环境。其核心研究问题是如何在高密度人群中准确检测和识别个体,这对于智能监控、自动驾驶和公共安全等领域具有重要意义。CrowdHuman的发布极大地推动了行人检测技术的发展,为相关研究提供了丰富的数据资源。
当前挑战
CrowdHuman数据集在构建过程中面临了多重挑战。首先,高密度人群中的遮挡问题严重影响了检测的准确性,如何有效处理遮挡是该数据集的主要挑战之一。其次,数据集的标注工作复杂且耗时,确保标注的准确性和一致性是一个巨大的挑战。此外,数据集的多样性和复杂性要求算法具备强大的泛化能力,以应对不同场景下的行人检测任务。这些挑战不仅推动了行人检测技术的进步,也为其他相关领域的研究提供了宝贵的经验。
发展历史
创建时间与更新
CrowdHuman数据集由Shanghai Jiao Tong University和Microsoft Research Asia于2018年共同创建,旨在解决人群中行人检测的挑战。该数据集自创建以来,未有公开的更新记录。
重要里程碑
CrowdHuman数据集的发布标志着行人检测领域的一个重要里程碑。它包含了15,000张图像,总计470,000个标注的行人实例,其中每个实例都提供了头部和全身的边界框标注。这一数据集的独特之处在于其对遮挡和拥挤场景的广泛覆盖,极大地推动了行人检测算法在复杂环境中的性能提升。此外,CrowdHuman还引入了遮挡标签,为研究遮挡问题提供了宝贵的数据资源。
当前发展情况
CrowdHuman数据集自发布以来,已成为行人检测研究中的重要基准。其丰富的标注和复杂的场景设计,使得许多先进的检测算法在其上进行了验证和优化。该数据集不仅推动了行人检测技术的发展,还促进了多目标跟踪和人群分析等领域的研究。随着深度学习技术的不断进步,CrowdHuman数据集的应用范围也在不断扩展,为智能监控、自动驾驶等实际应用场景提供了强有力的支持。
发展历程
  • CrowdHuman数据集首次发表,由ShanghaiTech、Microsoft Research Asia和Tsinghua University的研究团队共同推出,旨在解决人群中行人检测的挑战。
    2018年
  • CrowdHuman数据集在计算机视觉领域的多个国际会议上被广泛讨论和引用,成为人群检测任务中的重要基准数据集。
    2019年
  • CrowdHuman数据集的应用扩展到自动驾驶和智能监控领域,多个研究团队基于该数据集开发了新的行人检测算法。
    2020年
  • CrowdHuman数据集的标注质量和多样性得到了进一步的验证和提升,成为全球范围内行人检测研究的重要参考。
    2021年
常用场景
经典使用场景
在计算机视觉领域,CrowdHuman数据集因其大规模和高密度的人群图像而备受瞩目。该数据集广泛应用于人群检测和行人重识别任务中,为研究人员提供了丰富的样本资源。通过分析CrowdHuman数据集,研究者能够开发和验证更高效的人群检测算法,特别是在复杂场景下,如拥挤的街道、体育场馆和公共集会场所。
解决学术问题
CrowdHuman数据集解决了在人群密集场景中行人检测的难题。传统的行人检测算法在处理高密度人群时往往表现不佳,容易出现漏检或误检。CrowdHuman数据集通过提供高质量的标注数据,帮助研究者开发出更鲁棒的检测模型,显著提升了在复杂环境下的检测精度。这不仅推动了计算机视觉领域的发展,也为相关技术的实际应用奠定了坚实基础。
衍生相关工作
基于CrowdHuman数据集,许多经典工作得以展开。例如,研究者们开发了多种先进的行人检测算法,如基于深度学习的YOLO系列和Faster R-CNN的改进版本,这些算法在CrowdHuman数据集上的表现显著优于传统方法。此外,该数据集还促进了行人重识别技术的研究,推动了多目标跟踪和人群行为分析等领域的发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

ImageNet-1K(ILSVRC2012)

ImageNet-1K(ILSVRC2012)是一个大规模的图像分类数据集,包含1000个类别的图像,用于训练和验证图像分类模型。

github 收录

UniMed

UniMed是一个大规模、开源的多模态医学数据集,由穆罕默德·本·扎耶德人工智能大学等机构创建,包含超过530万张图像-文本对,涵盖六种不同的医学成像模态:X射线、CT、MRI、超声、病理和眼底。数据集通过利用大型语言模型(LLMs)将特定模态的分类数据集转换为图像-文本格式,并结合现有的医学图像-文本数据,实现了可扩展的视觉-语言模型(VLM)预训练。UniMed旨在解决医学领域中公开可用的大规模图像-文本数据稀缺的问题,适用于多种医学成像任务,如零样本分类和跨模态泛化。

arXiv 收录