DeepArt

Name: DeepArt
Creator: 重庆邮电大学自动化学院
Published: 2023-12-25 02:51:05
License: 暂无描述

arXiv2023-12-25 更新2024-06-21 收录

下载链接：

https://github.com/rickwang28574/DeepArt

下载链接

链接失效反馈

官方服务：

资源简介：

DeepArt数据集由重庆邮电大学自动化学院的研究团队创建，包含301幅由现代中国艺术家Feng Zikai手绘的诗画作品及其对应的GPT-4生成的图像。该数据集通过精心挑选的诗画作品，展示了GPT-4在图像合成中的纹理特征保真度。创建过程中采用了基于GPT-4的‘编码-解码’映射方法，以生成与原始数据相对应的合成数据。DeepArt数据集主要用于推动AI生成内容（AIGC）的保真度研究，特别是在多模态大型模型如GPT-4的图像生成能力评估中。

The DeepArt dataset was created by a research team from the School of Automation, Chongqing University of Posts and Telecommunications. It contains 301 hand-painted poetic painting works by Feng Zikai, a modern Chinese artist, along with their corresponding images generated by GPT-4. This dataset showcases the texture feature fidelity of GPT-4 in image synthesis through carefully selected poetic painting works. During its creation, a GPT-4-based "encode-decode" mapping method was adopted to generate synthetic data corresponding to the original dataset. The DeepArt dataset is primarily used to advance the research on the fidelity of AI-generated content (AIGC), especially in the evaluation of the image generation capabilities of multimodal large models such as GPT-4.

提供机构：

重庆邮电大学自动化学院

创建时间：

2023-12-16

搜集汇总

数据集介绍

构建方式

DeepArt数据集的构建方式基于GPT-4的多模态大语言模型，旨在评估其在图像合成中纹理特征的保真度。首先，数据集选择了301幅来自中国著名画家丰子恺的高质量诗画作为原始数据，这些画作代表了真实的人类艺术表达，具有高水平的手工艺和艺术性。然后，通过GPT-4的“编码-解码”映射方法，将原始数据转化为与之对应的合成数据，形成了一组具有意义的人工数据和生成图像的对。这种方法不仅提高了数据集的多样性，也使得数据集更具可访问性和实用性。

使用方法

使用DeepArt数据集的方法主要包括两个方面：定性分析和定量分析。在定性分析中，研究者可以观察并比较人工绘画和GPT-4生成的图像之间的差异，特别是纹理、风格和细节等方面的变化。在定量分析中，研究者可以使用深度学习模型对图像进行分类，以评估模型的识别能力。为了防止模型通过简单的特征学习（如风格）来完成任务，数据集采用了特殊的训练和测试策略，如使用多种骨干网络进行分类，并调整数据集的训练集和测试集的比例，以确保模型的泛化能力。

背景与挑战

背景概述

在当前人工智能技术迅猛发展的背景下，图像合成技术取得了显著的进展。DeepArt数据集的创建旨在推动人工智能生成内容（AIGC）领域的研究，特别是对图像合成中纹理特征保真度的研究。该数据集由重庆邮电大学自动化学院、美国阿拉巴马大学伯明翰分校计算机科学系以及阿尔皮尔杜尔政府工程与管理学院计算机科学与工程系的学者共同构建，于2023年12月发布。DeepArt数据集的核心研究问题是评估GPT-4等大型多模态语言模型在图像合成中的纹理特征保真度，通过对GPT-4生成的图像与人工绘制图像的对比，揭示了GPT-4在图像合成方面的局限性和挑战。DeepArt数据集的创建为AIGC领域的研究提供了重要的基准数据，对于推动该领域的技术进步具有重要的意义。

当前挑战

DeepArt数据集的研究面临着多方面的挑战。首先，在解决领域问题方面，DeepArt数据集旨在评估GPT-4等大型多模态语言模型在图像合成中的纹理特征保真度，这是一个极具挑战性的问题，因为图像合成需要模型具备对复杂纹理和细节的准确理解和生成能力。其次，在构建过程中，DeepArt数据集面临着如何有效地收集和标注数据、如何构建合适的基准数据集等挑战。为了解决这些挑战，DeepArt数据集采用了多种技术手段，包括基于GPT-4的“编码-解码”映射方法，以生成与人工绘制图像相对应的合成数据。此外，DeepArt数据集还采用了特殊的训练和测试策略，以避免神经网络出现“捷径学习”的问题。在未来的研究中，DeepArt数据集将继续探索新的技术和方法，以进一步提高AIGC领域的研究水平。

常用场景

经典使用场景

DeepArt数据集旨在评估和推动基于GPT-4等多模态大型语言模型的图像生成技术的逼真度研究。它通过将GPT-4生成的图像与人类手绘图像进行对比，揭示图像合成中的纹理特征保真度问题，为AIGC领域的研究提供了新的基准。

解决学术问题

DeepArt数据集解决了当前多模态大型语言模型在图像生成中存在的逼真度问题，特别是纹理特征的保真度。通过定量和定性实验，该数据集揭示了GPT-4等模型在图像生成中的局限性，并为AIGC技术的研究提供了新的挑战和方向。

实际应用

DeepArt数据集的实际应用场景包括但不限于绘画创作、产品设计、人机交互、医疗分析等领域。通过对GPT-4等模型生成的图像进行逼真度评估，可以帮助艺术家、设计师等专业人士更好地利用这些模型进行创作和设计，同时也可以为医疗诊断和教育等领域提供更准确和真实的图像数据。

数据集最近研究