IDEA-Bench|图像生成数据集|基准测试数据集
收藏IDEA-Bench 数据集概述
数据集简介
IDEA-Bench(Intelligent Design Evaluation and Assessment Benchmark)是一个全面的、开创性的基准测试,旨在提升图像生成模型在专业级应用中的能力。该数据集通过多样化的任务评估,填补了当前生成模型与专业图像设计需求之间的差距。
任务覆盖
IDEA-Bench 包含 100 个专业图像生成任务 和 275 个具体案例,系统性地分为以下五大类:
- 文本到图像 (T2I): 根据文本提示生成单张图像。
- 图像到图像 (I2I): 根据文本指导对输入图像进行转换或编辑。
- 多图像到图像 (Is2I): 从多张输入图像生成单张输出图像。
- 文本到多图像 (T2Is): 根据单个文本提示生成多张图像。
- (多)图像到多图像 (I(s)2Is): 从一张或多张输入图像生成多张输出图像。
评估框架
- 二元评分项: 包含 1,650 个二元评分项,以确保对生成图像进行精确、客观的评估。
- MLLM 辅助评估: 包含 18 个任务的代表性子集,采用增强的评估标准,利用 MLLM 将评估转化为图像理解任务,超越传统的 FID 和 CLIPScore 等指标,捕捉美学质量和上下文相关性。
数据集许可证
数据集中的图像和数据集受 LICENSE 文件中的条款约束,请参阅该文件以了解使用限制。
数据集获取
数据集可通过 Hugging Face 获取。
引用
如果您的研究受益于我们的工作,请考虑引用我们的论文: bibtex @misc{liang2024ideabenchfargenerativemodels, title={IDEA-Bench: How Far are Generative Models from Professional Designing?}, author={Chen Liang and Lianghua Huang and Jingwu Fang and Huanzhang Dou and Wei Wang and Zhi-Fan Wu and Yupeng Shi and Junge Zhang and Xin Zhao and Yu Liu}, year={2024}, eprint={2412.11767}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2412.11767}, }

网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
Oxford 102 Flowers
牛津102花卉数据集是一个主要用于图像分类的花卉集合数据集,分为102个类别,共102种花卉,其中每个类别包含40到258幅图像。 该数据集由牛津大学工程科学系2008年在相关论文 “大量类别上的自动花分类” 中发布
OpenDataLab 收录