five

EdgeMap345C_Dataset

收藏
github2023-01-31 更新2024-05-31 收录
下载链接:
https://github.com/PengBoXiangShang/EdgeMap345C_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含290,281个边缘映射的数据集,对应于345个对象类别,称为Edge-Map-345C。这些类别对应于Google QuickDraw数据集的345个自由手绘类别。数据集可用于网络的预训练,解决训练数据稀缺问题。

This dataset comprises 290,281 edge maps corresponding to 345 object categories, known as Edge-Map-345C. These categories align with the 345 freehand drawing categories from the Google QuickDraw dataset. The dataset is suitable for pre-training networks, addressing the issue of scarce training data.
创建时间:
2019-03-30
原始信息汇总

数据集概述

  • 名称: EdgeMap345C_Dataset
  • 包含内容: 290281个边缘图,对应345个物体类别
  • 类别对应: 与Google QuickDraw数据集的345个自由手绘类别相对应
  • 数据来源: 部分来自ImageNet,部分通过Google Images下载
  • 数据处理: 使用Edge Boxes工具箱提取边缘图,调整大小为3×224×224,由志愿者手动筛选
  • 数据划分: 随机分为训练集(263,655个样本)和验证集(26,626个样本)

数据集用途

  • 预训练网络: 用于解决训练数据稀缺问题,特别是在手绘研究领域

数据集下载

  • 训练集: 4.9GB,分为两个部分,可从Baiduyun Disk下载
  • 验证集: 490MB,可从Baiduyun Disk下载
  • 下载说明: 如需从Baiduyun下载,需联系Peng Xu获取提取码

引用信息

  • 引用格式:

@article{xu2020learning, title={On Learning Semantic Representations for Million-Scale Free-Hand Sketches}, author={Xu, Peng and Huang, Yongye and Yuan, Tongtong and Xiang, Tao and Hospedales, Timothy M and Song, Yi-Zhe and Wang, Liang}, journal={arXiv preprint arXiv:2007.04101}, year={2020} }

搜集汇总
数据集介绍
main_image_url
构建方式
EdgeMap345C_Dataset的构建过程分为两个主要步骤:图像收集与边缘图提取。首先,从ImageNet和Google Images中收集与345个QuickDraw类别对应的图像,确保每个类别至少有841张图像。对于ImageNet中的图像,通过裁剪标注的边界框区域来减少多对象图像的干扰。随后,使用Edge Boxes工具箱从收集的图像中提取边缘图,并将所有边缘图调整为3×224×224的尺寸。最后,通过人工筛选去除无法识别的边缘图,确保数据质量。
使用方法
EdgeMap345C_Dataset可用于深度学习模型的预训练与验证。用户可通过提供的下载链接获取训练集和验证集,分别以4.9GB和490MB的压缩包形式提供。数据集支持多种主流卷积神经网络(如MobileNet、ResNet、DenseNet等)的训练,并已在验证集上展示了不同模型的分类准确率。使用该数据集时,建议引用相关论文以支持学术研究。
背景与挑战
背景概述
EdgeMap345C_Dataset是由彭旭等人于2020年创建的一个边缘图数据集,旨在解决手绘草图识别领域中的数据稀缺问题。该数据集包含345个物体类别的290,281张边缘图,这些类别与Google QuickDraw数据集中的345个手绘草图类别相对应。通过从ImageNet和Google Images中收集图像,并使用Edge Boxes工具箱提取边缘图,研究人员构建了一个大规模的边缘图数据集。该数据集的构建不仅为草图识别任务提供了丰富的训练数据,还为深度学习模型的预训练提供了重要资源,推动了手绘草图识别领域的研究进展。
当前挑战
EdgeMap345C_Dataset在构建过程中面临了多重挑战。首先,数据收集阶段需要从ImageNet和Google Images中筛选出与QuickDraw类别相匹配的图像,这一过程涉及大量的手动筛选和图像裁剪工作,以确保图像质量与类别一致性。其次,边缘图提取过程中,尽管使用了自动化工具,但仍需人工干预以去除无法识别的杂乱边缘图,确保数据集的纯净度。此外,数据集的规模庞大,处理与存储需求较高,对计算资源提出了较高要求。在应用层面,尽管该数据集为草图识别任务提供了丰富的数据支持,但如何进一步提升模型在边缘图分类任务中的准确性,仍是当前研究的主要挑战之一。
常用场景
经典使用场景
EdgeMap345C_Dataset在计算机视觉领域中被广泛用于边缘检测和图像分类任务。该数据集包含了345个物体类别的290,281张边缘图,这些边缘图是通过从ImageNet和Google Images中提取的图像生成的。研究人员可以利用这些边缘图来训练和验证卷积神经网络(CNN)模型,以提升模型在边缘检测和图像分类任务中的表现。特别是在草图识别领域,该数据集为解决训练数据稀缺问题提供了有效的预训练资源。
解决学术问题
EdgeMap345C_Dataset解决了草图识别和图像分类领域中的训练数据稀缺问题。通过提供大量高质量的边缘图,研究人员可以在缺乏足够草图数据的情况下,利用这些边缘图进行模型预训练,从而提升模型在草图识别任务中的泛化能力。此外,该数据集还为边缘检测算法的研究提供了丰富的实验数据,推动了相关领域的技术进步。
实际应用
EdgeMap345C_Dataset在实际应用中具有广泛的应用场景,特别是在草图识别和图像分类领域。例如,在智能绘画辅助系统中,该数据集可以用于训练模型以识别用户绘制的草图,并提供相应的反馈或建议。此外,该数据集还可以用于开发智能图像搜索系统,通过边缘图匹配技术快速找到与用户输入草图相似的图像。
数据集最近研究
最新研究方向
在计算机视觉领域,边缘检测与草图识别一直是研究的热点。EdgeMap345C_Dataset作为一个包含345个对象类别、总计290,281张边缘图的数据集,为这一领域的研究提供了丰富的资源。该数据集与Google QuickDraw数据集相对应,能够有效解决草图识别中训练数据稀缺的问题。近年来,基于深度学习的边缘检测和草图识别技术取得了显著进展,EdgeMap345C_Dataset的发布为这些技术的进一步优化提供了新的实验平台。通过在该数据集上预训练网络,研究者可以显著提升模型在草图识别任务中的表现,尤其是在跨域迁移学习和数据增强方面展现出巨大潜力。此外,该数据集还为多类别边缘检测和细粒度分类任务提供了新的研究方向,推动了计算机视觉领域的前沿探索。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作