SOEBench|计算机视觉数据集|图像生成数据集
收藏SOEBench 数据集概述
数据集简介
- 名称: SOEBench
- 类型: 用于文本引导的小对象编辑的标准化基准数据集
- 来源: 从MSCOCO和OpenImage收集
- 规模: 包含4000张图像
- 目标: 定量评估文本引导的小对象编辑(SOE)
数据集特点
- 方法: 引入了一种无需训练的跨注意力引导方法,以解决小对象编辑中的对齐问题。
- 优势: 通过局部和全局注意力引导策略,显著提高了模型根据文本描述准确渲染小对象的能力。
方法概述
- 基线方法: 提供了一种强基线方法,通过联合注意力引导策略,从局部和全局角度增强跨注意力图的对齐精度。
- 特点: 该方法无需训练,但在解决小对象编辑问题上非常有效。
相关资源
BibTeX
bibtex @misc{Anonymous2024Anonymous, title={Towards Small Object Editing: A Benchmark Dataset and A Training-Free Approach}, author={Anonymous Authors}, year={2024}, eprint={XXXX.XXXX}, archivePrefix={arXiv}, primaryClass={cs.CV} }

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
TT100K - Tsinghua-Tencent 100K
TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。
cg.cs.tsinghua.edu.cn 收录
Open-industrial-datasets
一个开放的工业应用数据集集合,按类别划分。欢迎提出拉取请求。如果数据集页面已经链接到论文,则不会包含论文链接。
github 收录