CCPD2020|车牌识别数据集|新能源车牌数据集
收藏数据集概述
1. 环境配置
- Python版本: 3.6或3.7
- Pytorch版本: 1.7.1(必须为1.6.0或以上)
- 依赖库: pycocotools(Linux:
pip install pycocotools
;Windows:pip install pycocotools-windows
) - 推荐: 使用GPU进行训练
2. 文件结构
- cfg: 配置文件目录,包含超参数文件
hyp.yaml
和网络结构配置文件yolov3-spp.cfg
- data: 存储训练数据集相关信息缓存
- runs: 保存训练过程中的TensorBoard文件
- build_utils: 包含搭建网络所需的工具文件,如数据读取、图像处理、基础层实现等
- train_utils: 训练工具,包括多GPU训练和使用cocotools
- test_utils: LPR网络构建工具
- LPR_model: LPR网络构建
- result: 存放预测结果
- My_LPRnet_Dataset: 处理好的LPR网络数据集
- My_yolo_dataset: 处理好的YOLO网络数据集
- weights: 存储训练权重,包括YOLO和LPR网络的预训练和训练好的权重
- model.py: YOLO模型搭建文件
- train.py: 单GPU或CPU训练脚本
- train_multi_GPU.py: 多GPU训练脚本
- trans_voc2yolo.py: VOC数据集标注信息转为YOLO格式
- train_LPRNet.py: LPRnet训练脚本
- CCPD_trans_YOLOdataset.py: CCPD数据集转为YOLO标注格式
- CCPD_trans_LPRdataset.py: CCPD数据集转为LPRnet需要格式
- calculate_dataset.py: 统计数据集信息并生成配置文件
- predict_test.py: 预测测试脚本
3. 训练数据准备及目录结构
-
建议: 使用YOLO格式的标签文件
.txt
,推荐使用标注软件labelImg -
目录结构:
├── my_yolo_dataset │ ├── train │ │ ├── images │ │ └── labels │ └── val │ ├── images │ └── labels
4. 数据集准备文件生成
- 脚本:
calculate_dataset.py
用于生成训练和验证数据的路径文件、类别名称文件及配置文件 - 配置: 需根据实际路径调整脚本参数
5. 预训练权重下载
- 权重文件: 包括
yolov3-spp-ultralytics-416.pt
,yolov3-spp-ultralytics-512.pt
,yolov3-spp-ultralytics-608.pt
,yolov3spp-29.pt
,My_LPRnet_Dataset
- 下载链接: 提供百度网盘下载链接及密码
7. 使用方法
- 准备: 提前准备好数据集和预训练模型权重
- 训练: 单GPU或CPU使用
train.py
,多GPU使用特定指令启动train_multi_GPU.py

Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
CMAB
CMAB数据集由清华大学创建,是中国首个全国范围的多属性建筑数据集,涵盖了3667个自然城市,总面积达213亿平方米。该数据集通过集成多源数据,如高分辨率Google Earth影像和街景图像,生成了建筑的屋顶、高度、功能、年龄和质量等属性。数据集的创建过程结合了地理人工智能框架和机器学习模型,确保了数据的高准确性。CMAB数据集主要应用于城市规划和可持续发展研究,旨在提供详细的城市3D物理和社会结构信息,支持城市化进程和政府决策。
arXiv 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录