five

SortScrews

收藏
arXiv2026-03-13 更新2026-03-17 收录
下载链接:
https://github.com/ATATC/SortScrews
下载链接
链接失效反馈
官方服务:
资源简介:
SortScrews是由多伦多大学等机构联合创建的螺丝分类数据集,包含560张512×512分辨率的RGB图像,涵盖六种螺丝类型和一个背景类。数据通过标准化采集设备获取,包含四种不同光照和视角的轻微变化设置,旨在支持工业自动化中的螺丝识别研究。该数据集采用平衡设计,每类80个样本,并附带可扩展的数据采集脚本,适用于轻量级模型在受控环境下的细粒度分类任务。

SortScrews is a screw classification dataset jointly developed by the University of Toronto and other institutions. It contains 560 RGB images with a resolution of 512×512, covering six types of screws and one background class. The dataset was collected using standardized acquisition equipment, with four sets of slight variations in lighting and viewing angles, and is intended to support screw recognition research in industrial automation. This dataset adopts a balanced design with 80 samples per category, and also includes scalable data collection scripts, which are suitable for fine-grained classification tasks of lightweight models in controlled environments.
提供机构:
多伦多大学; 向量研究所; Project Neura; UTMIST; Amplimit
创建时间:
2026-03-13
原始信息汇总

SortScrew 数据集概述

数据集简介

SortScrew 是一个用于螺丝分类的数据集。该数据集收集了 6 种类型螺丝的 560 张图像。

数据集引用

如需在学术工作中使用此数据集,请引用以下文献: bibtex @misc{fu2026sortscrewsdatasetbaselinerealtime, title={SortScrews: A Dataset and Baseline for Real-time Screw Classification}, author={Tianhao Fu and Bingxuan Yang and Juncheng Guo and Shrena Sribalan and Yucheng Chen}, year={2026}, eprint={2603.13027}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2603.13027}, }

数据集下载

您可以通过以下两种方式下载数据集:

  1. 从 Project Neura 中央数据服务器直接下载:https://cds.projectneura.org/atatc/ut/esc102/SortScrews.zip
  2. 使用 MIP Candy 工具下载: python from mipcandy import download_dataset download_dataset("atatc/ut/esc102/SortScrews", "directory/to/save/dataset")

代码库安装

数据集提供了配套的代码库,包含使用数据集所需的必要工具。 shell pip install git+https://github.com/ATATC/SortScrews

如需自定义数据集、训练模型或使用代码库进行推理,请克隆整个代码库。

类别索引

螺丝类别按其长度排序。类别索引从 1 到 6 分配,对应从左到右的顺序。 类别 0 预留给背景。

数据集自定义

您可以使用代码库中的 collect.py 脚本来收集您自己的数据集。 脚本操作按键说明如下:

  • <kbd>C</kbd>:捕获当前帧
  • <kbd>X</kbd>:删除最后一条记录
  • <kbd>0</kbd> - <kbd>9</kbd>:设置类别 ID
  • <kbd>Q</kbd>:退出

若要在现有数据集基础上追加数据,请将代码 app = Collector() 替换为 app = Collector(append_from=LENGTH_OF_EXISTING_DATASET)

使用许可

数据集创建者要求其他 Praxis II 小组不要复制其解决方案,并且不允许其他小组使用此数据集。

搜集汇总
数据集介绍
main_image_url
构建方式
在工业自动化与机器人技术领域,螺丝的精确识别对于提升分拣效率至关重要。SortScrews数据集的构建采用了一套标准化的采集流程,通过iCAN C55N QHD 2K网络摄像头与木质支架组成的简易设备,配合打印的定位引导板,确保每个螺丝样本被置于校准区域内。数据采集在四种不同的设置下进行,引入了光照与相机视角的轻微变化,以模拟工业环境中常见的条件波动。最终,数据集包含了560张分辨率为512×512的RGB图像,覆盖六种螺丝类型及一个背景类,每类样本数量均衡,为80张,并通过CSV文件提供清晰的图像文件名与类别标签对应关系。
特点
SortScrews数据集的特点在于其针对细粒度视觉识别的精心设计。数据集专注于六种常见螺丝类型,这些类型在头部形状、长度和螺纹结构上存在细微差异,对分类算法提出了较高要求。图像均在受控条件下采集,保证了对象放置的一致性,同时通过有限的光照与视角变化增强了数据的泛化能力。此外,数据集的规模虽小,但类别平衡且包含背景类,支持在实际分拣流程中实现简单的拒识机制。这些特点使得该数据集成为评估轻量级模型在有限数据下学习能力的理想基准。
使用方法
该数据集的使用旨在推动工业视觉识别与自动分拣系统的研究。用户可通过提供的GitHub仓库获取数据集、采集脚本与训练代码,利用CSV标注文件快速加载图像与标签。基准方法采用基于ImageNet预训练的EfficientNet-B0和ResNet-18模型,通过迁移学习进行微调,输入图像统一缩放至224×224分辨率,使用交叉熵损失与AdamW优化器进行训练。实验表明,即使在较小数据集上,这些轻量级模型也能实现较高的分类准确率。数据集还可用于探索细粒度分类中的失败案例,或扩展至多视角、深度信息等更复杂的工业场景。
背景与挑战
背景概述
在工业自动化与机器人技术迅猛发展的背景下,自动识别螺丝类型对于提升自动化分拣、库存管理及装配系统的效率至关重要。然而,针对螺丝分类的公开数据集极为稀缺,尤其是在自动化分拣系统中常见的受控单物体场景。为此,多伦多大学与Vector Institute等机构的研究团队于2026年发布了SortScrews数据集,旨在解决工业环境中细粒度视觉识别的核心问题。该数据集包含560张RGB图像,覆盖六种螺丝类型及一个背景类别,图像在标准化采集设置下获取,并引入了光照与视角的轻微变化,以模拟真实工业环境。SortScrews的推出填补了工业组件识别领域的空白,为自动化分拣系统的算法开发提供了宝贵的基准资源。
当前挑战
SortScrews数据集所应对的领域挑战在于细粒度工业组件的视觉识别。螺丝类型之间往往仅存在细微的几何差异,如头部形状、长度或螺纹模式,这些差异在视觉上难以区分,要求模型具备高精度的特征提取能力。此外,工业环境通常面临标注数据有限与采集条件受限的困境,使得在小型数据集上实现鲁棒分类成为一项艰巨任务。在数据集构建过程中,研究团队需克服采集标准化与数据平衡的挑战。通过设计物理引导装置与可重复的数据采集脚本,确保了物体放置的一致性与图像质量的稳定性,同时通过引入轻微的环境变化增强了数据的泛化性,为后续研究提供了可扩展的框架。
常用场景
经典使用场景
在工业自动化与机器人技术领域,SortScrews数据集为螺丝视觉分类任务提供了标准化的基准测试平台。该数据集通过精心设计的采集环境,模拟了自动化分拣系统中常见的单物体识别场景,使得研究人员能够在受控条件下评估和优化分类算法。其经典使用场景主要聚焦于基于深度学习的细粒度物体识别,特别是在有限数据条件下如何实现高精度分类,为工业组件的自动化识别提供了可复现的实验框架。
解决学术问题
SortScrews数据集有效解决了工业视觉中细粒度物体识别的关键学术问题。针对螺丝类别间仅存在细微几何差异的挑战,该数据集通过标准化采集设置和轻度环境变化,为研究小样本学习、迁移学习以及模型鲁棒性提供了实验基础。它填补了公开工业组件数据集的稀缺性,使得学术界能够系统探索在受限数据条件下如何提升分类性能,推动了自动化分拣与库存管理领域算法研究的可比较性与可重复性。
衍生相关工作
围绕SortScrews数据集,已衍生出多项经典研究工作,主要集中在工业视觉的算法优化与应用扩展领域。例如,基于该数据集的迁移学习研究探索了如何将ImageNet预训练模型有效适配至小规模工业数据;同时,针对细粒度分类的挑战,后续工作引入了多视角采集、数据增强以及注意力机制等改进策略。这些研究不仅提升了螺丝分类的准确率,也为其他工业组件的识别任务提供了方法论参考,推动了整个工业视觉领域向更高效、更鲁棒的方向发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作