PersonaBank
收藏arXiv2017-08-30 更新2024-06-21 收录
下载链接:
http://nlds.soe.ucsc.edu/personabank
下载链接
链接失效反馈官方服务:
资源简介:
PersonaBank是由加州大学圣克鲁兹分校自然语言与对话系统实验室创建的一个包含108个个人故事的数据集,每个故事都附有其故事意图图(STORY INTENTION GRAPH,SIG),这是一种深度故事结构表示。数据集中的故事主题多样,包括爱情、旅行、体育等,并已标注了整体正负情绪。创建过程中,使用了DramaBank的工具Scheherezade进行故事的标注,以生成SIG。该数据集主要用于支持日常叙事、叙事建模、语言生成和语言处理等领域的研究,旨在通过不同的叙事风格和共叙事来重述故事,或作为内容规划器使用。
PersonaBank is a dataset consisting of 108 personal stories, developed by the Natural Language and Dialogue Systems Lab at the University of California, Santa Cruz. Each story is paired with its Story Intention Graph (SIG), a deep structural representation of narrative structures. The stories in the dataset cover diverse themes including love, travel, sports and other topics, and have been annotated with overall positive or negative sentiment. During the construction of this dataset, the Scheherezade tool from DramaBank was utilized to annotate the stories and generate the SIGs. This dataset is primarily designed to support research in fields such as everyday narration, narrative modeling, language generation and natural language processing, with the goal of retelling stories through different narrative styles and co-narration, or serving as a content planner.
提供机构:
加州大学圣克鲁兹分校自然语言与对话系统实验室计算机科学系
创建时间:
2017-08-30
搜集汇总
数据集介绍

构建方式
PersonaBank数据集构建方式描述
特点
PersonaBank数据集特点描述
使用方法
PersonaBank数据集使用方法描述
背景与挑战
背景概述
PersonaBank是一个包含108篇个人故事的语料库,这些故事来自网络日志,并已被标注为STORY INTENTION GRAPHS (SIG),这是一种故事的深层表示形式。这些故事的主题包括浪漫、旅行、运动、节日、观察野生动物和天气。故事还根据整体积极和消极的语气进行了标注。SIG表示提供了故事时间线的命题表示,故事角色的目标和动机,以及故事事件对角色情感的影响。PersonaBank语料库的创建时间是在2017年,由加利福尼亚大学圣克鲁兹分校的自然语言和对话系统实验室的Stephanie M. Lukin、Kevin Bowden、Casey Barackman和Marilyn A. Walker等人共同完成。该数据集的核心研究问题是探索个人叙述的叙事结构和语言生成,并已经对相关领域产生了重要影响,尤其是在计算叙事学、自然语言生成和语言处理等领域。
当前挑战
PersonaBank数据集面临的挑战包括:1) 所解决的领域问题是个人叙述的叙事结构分析和语言生成。2) 在构建过程中遇到的挑战包括:个人叙述中存在大量描述性内容,这些内容并不容易用SIG表示进行标注和解释;个人叙述中的一些表达可能在WordNet或VerbNet词典中找不到确切的词语或表达方式;对于同一个故事,可能存在多种不同的解释和标注方式。
常用场景
经典使用场景
PersonaBank数据集包含108个个人故事,这些故事已经被标注了故事意图图(STORY INTENTION GRAPHS, SIGs),这是一种对故事内容的深度表示。该数据集的经典使用场景包括:1)研究叙事结构理论,通过分析故事意图图来理解叙事的深层结构;2)语言处理,利用故事意图图来生成自然语言文本,例如故事重述、对话生成等;3)计算叙事,通过故事意图图来探索叙事风格和结构的变化。
衍生相关工作
PersonaBank数据集衍生了许多相关的经典工作,例如:1)Harmon和Jhala(2015)将故事意图图与Skald叙事生成器相结合,实现了叙事生成的同时保持了故事意图图的表示能力;2)Antoun等人(2015)使用故事意图图作为内容规划器,将游戏轨迹转化为自然语言总结;3)Hu等人(2016)发布了Story Dialogue with Gestures(SDG)语料库,其中包含50个个人叙事,这些叙事被呈现为两个智能体之间的对话,并带有完整的姿势和位置标注。
数据集最近研究
最新研究方向
PersonaBank数据集为故事意图图(SIG)的深入研究和应用提供了丰富的个人叙述资源。SIG作为一种深层叙事表示,在分析叙事结构、自然语言生成和语言处理等方面具有潜在的应用价值。当前的研究方向包括探索如何利用SIG进行故事重述、合作讲述和内容规划,以及如何通过SIG生成不同风格的叙事变体。此外,研究还关注如何从SIG的诠释层中提取角色情感,并利用这些信息来增强叙事体验。PersonaBank数据集为这些研究提供了宝贵的数据支持,有望推动叙事模型和语言生成技术的发展。
相关研究论文
- 1PersonaBank: A Corpus of Personal Narratives and Their Story Intention Graphs加州大学圣克鲁兹分校自然语言与对话系统实验室计算机科学系 · 2017年
以上内容由遇见数据集搜集并总结生成



