GATE OpenING

github2024-11-29 更新2024-11-30 收录

下载链接：

https://github.com/LanceZPF/OpenING

下载链接

链接失效反馈

官方服务：

资源简介：

GATE OpenING是一个综合基准，包含5,400个高质量的人工标注实例，涵盖56个现实世界任务。该基准覆盖了多种日常场景，如旅行指南、设计和头脑风暴，提供了一个强大的平台来挑战交错生成方法。

GATE OpenING is a comprehensive benchmark comprising 5,400 high-quality manually annotated instances across 56 real-world tasks. This benchmark covers diverse everyday scenarios such as travel guides, design, and brainstorming, and provides a robust platform for evaluating interleaved generation methods.

创建时间：

2024-11-26

原始信息汇总

OpenING 数据集概述

数据集简介

名称: GATE OpenING (OpenING)
类型: 综合基准数据集
规模: 包含5,400个高质量人工标注实例
任务数量: 涵盖56个现实世界任务
应用场景: 旅行指南、设计、头脑风暴等多样化日常场景
目标: 提供一个强大的平台，用于挑战交错生成方法

数据集特点

IntJudge模型: 用于评估开放式多模态生成方法的评判模型，与人类判断的协议率达到82.42%，优于基于GPT的评估器11.34%。
实验结果: 当前交错生成方法仍有显著改进空间。

数据集更新

2024/11/29: 发布IntJudge模型，可用于在数据公开前获取模型在OpenING上的测试结果。
2024/11/28: 发布评估代码。
2024/11/27: 发布GATE OpenING技术报告，并推出项目页面。

数据集使用

快速开始: 参考Quickstart.md文件。
动态排行榜: 查看动态排行榜。

数据集声明

版权声明: 标注者严格遵守初始数据源的版权和许可规则，避免使用禁止复制和重新分发的网站材料。
版权问题: 如发现任何可能违反版权或许可规定的数据样本，请联系我们进行验证和移除。

联系信息

Pengfei Zhou: zpf4wp@outlook.com
Kaipeng Zhang: zhangkaipeng@pjlab.org.cn

引用信息

bibtex @misc{zhou2024GATE, title={GATE OpenING: A Comprehensive Benchmark for Judging Open-ended Interleaved Image-Text Generation}, author={Pengfei Zhou, Xiaopeng Peng, Jiajun Song, Chuanhao Li, Zhaopan Xu, Yue Yang, Ziyao Guo, Hao Zhang, Yuqi Lin, Yefei He, Lirui Zhao, Shuo Liu, Tianhua Li, Yuxuan Xie, Xiaojun Chang, Yu Qiao, Wenqi Shao, and Kaipeng Zhang}, year={2024}, eprint={2411.18499}, archivePrefix={arXiv}, primaryClass={cs.CV} }

搜集汇总

数据集介绍

构建方式

GATE OpenING数据集的构建基于5,400个高质量的人工标注实例，涵盖了56个现实世界任务，涉及旅游指南、设计和头脑风暴等多样化日常场景。该数据集通过严格的版权和许可规则，确保所有数据来源的合法性，避免使用任何禁止复制和再分发的材料。此外，数据集的构建过程中引入了IntJudge模型，该模型经过专门训练，能够以82.42%的准确率与人类判断达成一致，显著优于基于GPT的评估器。

特点

GATE OpenING数据集的显著特点在于其全面性和高质量。它不仅涵盖了广泛的现实世界任务，还通过IntJudge模型提供了先进的评估能力，使得该数据集成为评估和推动交错图像文本生成方法的强大平台。此外，数据集的构建严格遵守版权和许可规则，确保了数据的合法性和可靠性。

使用方法

使用GATE OpenING数据集时，用户可以通过提供的评估代码快速启动，并利用IntJudge模型进行模型性能的评估。数据集的动态排行榜提供了模型在不同评估标准下的表现，帮助用户了解当前最先进的生成方法。此外，用户可以通过联系数据集的维护团队，获取更多关于数据集使用的技术支持和指导。

背景与挑战

背景概述

GATE OpenING数据集由Pengfei Zhou、Xiaopeng Peng等研究人员于2024年创建，旨在为开放式交错图像-文本生成提供一个全面的基准。该数据集包含5,400个高质量的人工标注实例，涵盖56个现实世界任务，涉及旅行指南、设计和头脑风暴等多种日常场景。通过引入IntJudge模型，该数据集不仅提供了一个评估开放式多模态生成方法的平台，还展示了当前交错生成方法的改进空间。GATE OpenING的发布标志着多模态语言模型（MLLMs）领域的一个重要里程碑，预期将推动该领域向通用多模态智能的方向发展。

当前挑战

GATE OpenING数据集在构建过程中面临多重挑战。首先，确保数据集的高质量标注是一个复杂的过程，需要严格遵守版权和许可规则。其次，开发IntJudge模型以评估开放式多模态生成方法，需要创新的数据处理管道和高度一致的模型训练。此外，当前的交错生成方法在实际应用中仍存在显著的改进空间，这要求研究人员不断探索和优化生成模型。最后，确保数据集的广泛适用性和持续更新，以适应多模态智能领域的快速发展，也是一个重要的挑战。

常用场景

经典使用场景

GATE OpenING数据集在多模态生成领域中占据着举足轻重的地位，其经典使用场景主要集中在评估和改进图像与文本交织生成的模型。通过提供5,400个高质量的人工标注实例，涵盖56个现实世界任务，如旅游指南、设计和头脑风暴等，该数据集为研究者提供了一个全面的平台，用以测试和优化当前的交织生成方法。此外，数据集还引入了IntJudge模型，该模型在评估开放式多模态生成方法方面表现出色，其与人类判断的一致率高达82.42%，显著超越了基于GPT的评估器。

解决学术问题

GATE OpenING数据集在学术研究中解决了多模态生成模型评估的难题，特别是在图像与文本交织生成的领域。通过提供详尽且多样化的标注数据，该数据集帮助研究者识别和解决现有模型在生成质量和一致性方面的不足。此外，IntJudge模型的引入，不仅提升了评估的准确性，还为开发更先进的生成模型提供了方向，推动了多模态生成技术的发展，为未来的研究奠定了坚实的基础。

衍生相关工作

GATE OpenING数据集的发布催生了多项相关研究工作，特别是在多模态生成和评估领域。许多研究者利用该数据集进行模型训练和评估，提出了多种改进的生成算法和评估方法。例如，一些研究团队基于IntJudge模型的框架，开发了新的评估指标和模型，进一步提升了多模态生成的一致性和质量。此外，该数据集还激发了对多模态生成技术在不同应用场景中的深入探索，推动了该领域的整体进步。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集