ImageNet-1k|图像分类数据集|计算机视觉数据集
收藏EfficientViT-B4 Pretraining on ImageNet-1k
数据集
- 名称: ImageNet-1k
- 描述: 包含1.2百万张图像,涵盖1000个类别。
- 加载方式: 使用Hugging Face的
datasets
库自动加载。
预训练
- 模型: EfficientViT-B4
- 输入尺寸: 256x256像素
- 训练方式: 从零开始训练,无初始权重。
- 优化器: AdamW
- 学习率: 1e-4(带指数衰减)
- 批量大小: 42(可根据GPU内存调整)
- 梯度累积: 3步
- 训练轮数: 16
- 数据增强: 调整大小、颜色抖动、随机水平翻转和归一化
环境要求
- GPU支持: 需要NVIDIA GPU,CUDA版本12.4(或兼容版本),CuDNN版本9。
- Hugging Face认证: 需要Hugging Face令牌以访问ImageNet-1k数据集。
训练脚本
- 启动脚本:
pre.py
- 功能: 初始化模型、设置数据管道、配置优化器和学习率调度器、开始或恢复训练。
Docker环境
- Docker镜像:
ghcr.io/anto18671/efficientvit-b4.r256:latest
- 运行命令:
docker run --gpus all --env HUGGINGFACE_TOKEN=<your_huggingface_token> ghcr.io/anto18671/efficientvit-b4.r256:latest
检查点
- 最佳模型: 自动保存,验证准确率提高时。
- 最后检查点: 每个epoch结束时保存,以便从最近状态恢复。
验证
- 验证频率: 每个epoch结束时进行验证。
- 评估指标: 损失和准确率。
许可证
- 许可证类型: MIT License

中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录