MiniPo, PoemSum
收藏arXiv2025-01-10 更新2025-01-14 收录
下载链接:
https://github.com/SofeeyaJ/Poetry-In-Pixels-Coling2025
下载链接
链接失效反馈官方服务:
资源简介:
MiniPo是一个多模态数据集,由1001首儿童诗歌及其对应的图像组成,旨在增强诗歌分析的多样性,特别是针对儿童诗歌的研究。该数据集通过从多个在线开放资源中收集数据,并经过数据清洗和验证,确保数据的准确性和一致性。PoemSum则包含3011首诗歌及其英文摘要,数据来源于多个在线资源,摘要则来自‘Poem Analysis’网站。这两个数据集的应用领域主要集中在诗歌的文本到图像生成任务中,旨在通过视觉化诗歌内容,帮助读者更好地理解和感受诗歌的深层含义。
MiniPo is a multimodal dataset consisting of 1001 children's poems and their corresponding images, aiming to enrich the diversity of poetry analysis, particularly research focused on children's poetry. This dataset is gathered from multiple online open resources, and then undergoes data cleaning and validation to guarantee the accuracy and consistency of the dataset. PoemSum, in contrast, includes 3011 poems and their corresponding English abstracts. The poem data is sourced from various online resources, while the abstracts are retrieved from the "Poem Analysis" website. The application domains of these two datasets primarily center on the poetry text-to-image generation task, with the goal of helping readers better comprehend and appreciate the deep connotations of poems by visualizing their content.
提供机构:
印度理工学院巴特那分校计算机科学与工程系, Adobe研究院
创建时间:
2025-01-10
搜集汇总
数据集介绍

构建方式
MiniPo数据集的构建过程主要围绕儿童诗歌的收集与整理展开。首先,研究团队从多个在线开放资源中精心挑选了1001首儿童诗歌,特别是以童谣为主,因其简洁的结构和易于理解的内容。为确保数据的准确性和一致性,团队由三名精通英语的本科生负责数据收集与验证。随后,通过数据清洗步骤,提取了每首诗歌的文本内容,并将其作为元数据整合到数据集中,以便后续的分析与处理。这一过程不仅确保了数据的高质量,还为诗歌的多模态研究提供了坚实的基础。
特点
MiniPo数据集的特点在于其专注于儿童诗歌的多模态表达。该数据集不仅包含诗歌的文本内容,还附有与诗歌情节相关的图像,极大地丰富了诗歌的视觉表达。每首诗歌都配有标题、文本和图像,形成了一个完整的多模态数据单元。此外,MiniPo的诗歌涵盖了多种主题和情感,能够为诗歌分析和图像生成任务提供多样化的样本。其简洁的诗歌结构和明确的主题使得该数据集在儿童诗歌研究中具有独特的优势。
使用方法
MiniPo数据集的使用方法主要围绕诗歌的多模态分析与图像生成展开。研究人员可以通过该数据集进行诗歌文本的自动摘要生成,提取诗歌中的情感、视觉元素和主题,进而利用这些信息生成与诗歌内容相匹配的图像。具体步骤包括:首先使用GPT-4o mini模型对诗歌进行摘要生成,随后通过PoeKey算法提取关键元素,最后将这些元素输入扩散模型生成图像。此外,MiniPo还可用于评估图像生成模型在儿童诗歌领域的表现,为诗歌的多模态研究提供新的视角和工具。
背景与挑战
背景概述
MiniPo和PoemSum数据集由印度理工学院帕特纳分校与Adobe研究院的研究团队于2025年提出,旨在解决诗歌到图像生成的复杂问题。诗歌作为一种独特的文学形式,其含义往往超越字面表达,传统的文本到图像生成模型在处理诗歌时面临巨大挑战。为此,研究团队提出了PoemToPixel框架,结合扩散模型和大型语言模型(LLMs),通过Prompt Tuning技术生成与诗歌内容高度契合的图像。MiniPo数据集包含1001首儿童诗歌及其对应的图像,PoemSum则包含3011首诗歌及其摘要,两者共同为诗歌图像生成提供了丰富的多模态数据支持。这一研究为文学与视觉艺术的交叉领域开辟了新的研究方向,推动了诗歌分析与图像生成技术的深度融合。
当前挑战
MiniPo和PoemSum数据集在构建和应用过程中面临多重挑战。首先,诗歌的复杂性和多义性使得图像生成模型难以准确捕捉其深层含义,尤其是情感、主题和视觉元素的提取与表达。其次,构建过程中,数据集的多样性和质量控制成为关键问题,尤其是儿童诗歌的收集与标注需要确保其简洁性和可解释性。此外,Prompt Tuning技术的应用虽然提升了图像生成的质量,但如何设计有效的提示词以引导模型生成符合诗歌意境的图像仍是一个技术难点。最后,扩散模型在处理复杂提示时的局限性也限制了其在诗歌图像生成中的表现,尤其是在多情感或多主题的诗歌中,单一图像难以全面表达其丰富内涵。
常用场景
经典使用场景
MiniPo和PoemSum数据集在诗歌图像生成领域具有广泛的应用场景。通过结合扩散模型和大语言模型,这些数据集被用于生成与诗歌内容高度契合的视觉图像。具体而言,MiniPo数据集专注于儿童诗歌,提供了1001首儿童诗歌及其对应的图像,而PoemSum数据集则包含了3011首诗歌及其摘要,涵盖了更广泛的诗歌类型和风格。这些数据集为诗歌的视觉化提供了丰富的素材,使得研究人员能够通过自动化的方式将诗歌的抽象情感和主题转化为具体的视觉表达。
实际应用
MiniPo和PoemSum数据集在实际应用中具有广泛的前景。它们可以用于教育领域,帮助儿童通过视觉化的方式更好地理解诗歌内容。此外,这些数据集还可以应用于文学研究和艺术创作,为诗人和艺术家提供灵感,帮助他们将诗歌中的情感和主题转化为视觉艺术作品。在文化传播领域,这些数据集也可以用于制作多语言的诗歌图像生成工具,促进不同文化之间的交流与理解。
衍生相关工作
MiniPo和PoemSum数据集衍生了一系列相关的研究工作。基于这些数据集,研究人员开发了PoemToPixel框架,该框架通过结合大语言模型和扩散模型,实现了诗歌到图像的自动生成。此外,PoeKey算法的提出也为诗歌图像生成提供了新的思路,使得生成的图像能够更好地捕捉诗歌的情感和主题。这些工作不仅推动了诗歌图像生成领域的发展,还为其他文学作品的视觉化提供了借鉴。
以上内容由遇见数据集搜集并总结生成



