coco2017, coco2014, BDD100k, Visdrone, Hand|目标检测数据集|计算机视觉数据集
收藏数据集概述
数据集内容
支持的训练方法和模型
- 多主流对象检测数据集训练:支持COCO2017, COCO2014, BDD100k, Visdrone, Hand等数据集。
- 模型压缩算法:包括剪枝、量化和知识蒸馏。
- 多骨干网络:支持Darknet-YOLOv3,Tiny-YOLOv3,Mobilenetv3-YOLOv3等。
数据集详情
- Dior:包含大量船舶和车辆实例,图像来自Google Earth。
- bdd100k:包含100,000个驾驶视频,覆盖不同天气和时间条件。
- Visdrone:由无人机拍摄,包含288个视频片段和102,090张静态图像,覆盖多种环境和对象。
训练命令
-
通用命令: bash python3 train.py --data ... --batch-size ... --weights ... --cfg ... --img-size ... --epochs ...
-
特定数据集命令:
-
COCO2017: bash python3 train.py --data data/coco2017.data --batch-size ... --weights weights/yolov3-608.weights -pt --cfg cfg/yolov3/yolov3.cfg --img-size ... --epochs ...
-
Dior: bash python3 train.py --data data/dior.data --batch-size ... --weights weights/yolov3-608.weights -pt --cfg cfg/yolov3/yolov3-onDIOR.cfg --img-size ... --epochs ...
-
bdd100k: bash python3 train.py --data data/bdd100k.data --batch-size ... --weights weights/yolov3-608.weights -pt --cfg cfg/yolov3/yolov3-bdd100k.cfg --img-size ... --epochs ...
-
Visdrone: bash python train.py --data data/visdrone.data --batch-size ... --weights weights/yolov3-608.weights -pt --cfg cfg/yolov3/yolov3-visdrone.cfg --img-size ... --epochs ...
-
模型压缩方法
剪枝
- 方法:包括常规剪枝、快捷剪枝、剪枝融合、规则剪枝、层剪枝和层通道剪枝。
- 步骤:
-
训练: bash python3 train.py --data ... -pt --batch-size ... --weights ... --cfg ...
-
剪枝:
-
常规剪枝: bash python3 normal_prune.py --cfg ... --data ... --weights ... --percent ...
-
规则剪枝: bash python3 regular_prune.py --cfg ... --data ... --weights ... --percent ...
-
快捷剪枝: bash python3 shortcut_prune.py --cfg ... --data ... --weights ... --percent ...
-
剪枝融合: bash python3 slim_prune.py --cfg ... --data ... --weights ... --percent ...
-
层剪枝: bash python3 layer_prune.py --cfg ... --data ... --weights ... --shortcut ...
-
层通道剪枝: bash python3 layer_channel_prune.py --cfg ... --data ... --weights ... --shortcut ... --percent ...
-
-
量化
-
方法:包括Dorefa量化和Google量化。
-
命令: bash python train.py --data ... --batch-size ... --weights ... --cfg ... --img-size ... --epochs ... --quantized 2
bash python train.py --data ... --batch-size ... --weights ... --cfg ... --img-size ... --epochs ... --quantized 1
知识蒸馏
- 方法:基于Hinton的蒸馏方法,结合检测网络进行部分改进。
- 命令: bash python train.py --data ... --batch-size ... --weights ... --cfg ... --img-size ... --epochs ... --t_cfg ... --t_weights ...
性能指标
多数据集性能
数据集 | YOLOv3-640 | YOLOv4-640 | YOLOv3-mobilenet-640 |
---|---|---|---|
Dior | 0.749 | - | - |
bdd100k | 0.543 | - | - |
Visdrone | 0.311 | 0.383 | 0.348 |
模型性能
结构 | 骨干网络 | 后处理 | 参数 | GFLOPS | mAP0.5 | mAP0.5:0.95 | 速度(推理/NMS/总) | FPS |
---|---|---|---|---|---|---|---|---|
YOLOv3 | 38.74M | 20.39M | 59.13M | 117.3 | 0.580 | 0.340 | 12.3/1.7/14.0 ms | 71.4fps |
YOLOv3tiny | 6.00M | 2.45M | 8.45M | 9.9 | 0.347 | 0.168 | 3.5/1.8/5.3 ms | 188.7fps |
YOLOv3-mobilenetv3 | 2.84M | 20.25M | 23.09M | 32.2 | 0.547 | 0.346 | 7.9/1.8/9.7 ms | 103.1fps |
YOLOv3tiny-mobilenetv3-small | 0.92M | 2.00M | 2.92M | 2.9 | 0.379 | 0.214 | 5.2/1.9/7.1 ms | 140.8fps |
YOLOv4 | - | - | 61.35M | 107.1 | 0.650 | 0.438 | 13.5/1.8/15.3 ms | 65.4fps |
YOLOv4-tiny | - | - | 5.78M | 12.3 | 0.435 | 0.225 | 4.1/1.7/5.8 ms | 172.4fps |
以上信息提供了数据集的详细描述、支持的训练方法和模型、以及性能指标,有助于用户快速了解和使用该数据集。

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
MineNetCD
MineNetCD数据集由慕尼黑工业大学等机构创建,是一个全球矿区变化检测的综合基准数据集。该数据集包含超过70k对的双时相高分辨率遥感图像,覆盖全球100个矿区,总面积约6756.88平方公里。数据集的创建过程结合了半自动标注和专家手动标注,确保了数据的精细度和准确性。MineNetCD数据集主要应用于矿区环境监测和可持续发展研究,旨在通过高精度的变化检测技术,帮助实现矿区的可持续管理和环境保护。
arXiv 收录
面试问题数据集
该数据集包含从技术内容自动提取的结构化问答对,用于研究和AI面试助手
github 收录