hugfaceguy0001/TangshiDalle3Images

Name: hugfaceguy0001/TangshiDalle3Images
Creator: hugfaceguy0001
Published: 2023-12-16 16:52:02
License: 暂无描述

Hugging Face2023-12-16 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/hugfaceguy0001/TangshiDalle3Images

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为唐诗配图数据集，包含了《唐诗三百首》中的231首唐诗，每首诗通过DALL·E 3生成三张宽幅图片，共693张图片。数据集中的每张图片都关联了唐诗的序号、原始提示词和DALL·E 3自动完善的绘画提示词。数据集的主要用途是为《唐诗三百首》提供插图，也可以用于微调文生图模型或语言模型。然而，数据集中部分图片含有不正确的文字，且部分图片与唐诗主题不匹配，因此在用于高精度需求的任务时需要严格检查。

提供机构：

hugfaceguy0001

原始信息汇总

唐诗配图数据集

数据集概述

数据来源: 《唐诗三百首》中共231首诗，包括五言律诗、七言律诗、五言绝句和七言绝句。
图片生成: 每首诗使用三种prompt格式生成三张宽幅图片，共693张图片。
图片规格: 分辨率为1792x1024的宽幅图片，质量为hd。

数据字段

image: 图片文件名。
poem_id: 唐诗序号，格式为{诗体}_{序号}，如wulv(五言律诗), qilv(七言律诗), wujue(五言绝句), qijue(七言绝句)。
prompt: 输入给DALL·E 3的原始提示词。
revised_prompt: DALL·E 3根据原始提示词自动完善的绘画提示词。

数据集用途

为《唐诗三百首》提供插图。
微调文生图模型以适用于诗句配图任务。
微调语言模型以适用于由诗句生成可视化的描述词的任务。

局限性

部分图片中含有文字，且文字多为乱码。
部分图片与唐诗主题不匹配，需严格检查匹配度。

数据集信息

配置名称: default
数据文件: data/train-*
许可证: openrail
任务类别: text-to-image
语言: 英语、中文
标签: art, culture, poem, dalle3, diffusion, Chinese
数据集名称: 唐诗配图数据集
数据集大小: n<1K
下载大小: 3485749230 bytes
数据集大小: 3817427239 bytes
训练集: 693个样本，3817427239 bytes

搜集汇总

数据集介绍

构建方式

唐诗配图数据集的构建，采取了对《唐诗三百首》中的经典诗篇进行视觉艺术再现的方式。具体而言，精选了五言律诗、七言律诗、五言绝句、七言绝句共计231首诗，每首诗通过三种不同的prompt格式，利用DALL·E 3生成对应的宽幅图片，从而构建出包含693张图片的数据集。

特点

该数据集的特色在于，它不仅包含了由DALL·E 3生成的视觉艺术作品，还详细记录了生成这些作品所用的原始提示词以及DALL·E 3自动完善的绘画提示词。这些图片均为高分辨率的宽幅格式，且在数据集中标注了诗体和序号，便于追踪和引用原诗。然而，数据集也存在局限性，如部分图片含有不正确的文字，以及部分图片与唐诗主题匹配度不高。

使用方法

用户在使用唐诗配图数据集时，可以将其作为插图的来源，为《唐诗三百首》提供视觉辅助。此外，数据集还可用于微调文生图模型，提升模型在诗句配图任务上的性能。同时，也适用于微调语言模型，以便更好地生成与诗句相匹配的视觉描述词。在使用过程中，用户需注意数据集中图片与诗文的匹配度和图片中文字的正确性。

背景与挑战

背景概述

唐诗配图数据集，由研究人员精心构建，旨在融合中国古典文学与当代人工智能艺术创作之精髓。该数据集依托于《唐诗三百首》，涵盖多种诗体，共计231首诗，通过DALL·E 3生成693张配图，每首诗对应三种不同格式的prompt。该数据集的创建，不仅为《唐诗三百首》的插图提供了新视角，也为文本到图像的生成模型微调提供了宝贵资源，对中国古典文学的数字化传播及人工智能艺术创作领域产生了积极影响。

当前挑战

数据集在构建过程中，面临了诸多挑战。首先，如何在保持诗意的前提下，生成与唐诗内容相匹配的图像，是创作过程中的一个难点。其次，数据集中部分图片含有文字，且文字准确性不高，尤其是汉字大多表现为乱码，这对于数据集的质量和应用效果构成了挑战。此外，部分图片与唐诗主题的匹配度不足，对于需要高精确度匹配的任务而言，这是一个待解决的问题。

常用场景

经典使用场景

在探索文本与图像相互转换的艺术领域，hugfaceguy0001/TangshiDalle3Images数据集以其独特的文本到图像转换任务，提供了一个经典的使用场景。该数据集结合了《唐诗三百首》中的精选诗篇与DALL·E 3图像生成技术，通过特定的提示词格式，创作出了与诗意相契合的视觉作品，为研究人员提供了一种将古典文学与当代图像生成技术相结合的新途径。

衍生相关工作

基于该数据集的研究成果，已经衍生出一系列相关的工作，包括对DALL·E 3模型的微调研究，对图像与文本匹配度的评估方法，以及结合深度学习技术的诗歌视觉化创作等。这些工作不仅拓展了数据集的应用范围，也为文学作品的数字化传播提供了新的视角和技术路径。

数据集最近研究