CrowdHuman|人群检测数据集|基准数据集数据集
收藏数据集概述
数据集名称
CrowdHuman
数据集目的
用于评估在人群场景中的检测器性能。
数据集规模
- 训练集:15000张图像
- 验证集:4370张图像
- 测试集:5000张图像
- 总人数实例:470K(训练和验证集)
- 平均每张图像人数:23人
数据集特点
- 包含多种遮挡情况
- 每个人实例标注有头部边界框、可见区域边界框和全身边界框
数据集结构
标注格式
-
文件格式:
odgt
,每行是一个JSON,包含对应图像的所有标注信息。 -
JSON结构: python JSON{ "ID" : image_filename, "gtboxes" : [gtbox], } gtbox{ "tag" : "person" or "mask", "vbox": [x, y, w, h], "fbox": [x, y, w, h], "hbox": [x, y, w, h], "extra" : extra, "head_attr" : head_attr, } extra{ "ignore": 0 or 1, "box_id": int, "occ": int, } head_attr{ "ignore": 0 or 1, "unsure": int, "occ": int, }
-
标注说明:
tag
为mask
表示该框为人群/反射/类似人物等,需忽略(extra
中的ignore
为1
)vbox, fbox, hbox
分别表示可见框、全框、头框
下载链接
- 训练集:CrowdHuman_train01.zip
- 训练集:CrowdHuman_train02.zip
- 训练集:CrowdHuman_train03.zip
- 验证集:CrowdHuman_val.zip
- 训练标注:annotation_train.odgt
- 验证标注:annotation_val.odgt
- 测试集:CrowdHuman_test.zip
使用指南
标注转换
- 使用脚本
crowdhuman2coco.py
将CrowdHuman标注转换为COCO格式。
数据集类
-
提供PyTorch和MegEngine的简单实现,用于读取CrowdHuman数据集。
-
数据集类支持的返回顺序: python class CrowdHuman(VisionDataset): supported_order = ( "image", "boxes", "vboxes", "hboxes", "boxes_category", "info", )
-
示例使用: python crowdhuman_dataset = CrowdHuman( root=path/to/CrowdHuman, ann_file=path/to/annotations.json, remove_images_without_annotations=True, order=[ image, boxes, boxes_category info ] )

CosyVoice 2
CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。
arXiv 收录
World Flights
该数据集包含使用OpenSky Network实时API收集的两小时飞行数据。飞行颜色基于出发国家,记录了18000次飞行,由于缺乏卫星覆盖,海洋上的航线不完整。每条航线还加入了来自airlinecodes.co.uk的航空公司信息。
github 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录