five

narrative-engine-emotion-5c

收藏
Hugging Face2025-08-29 更新2025-08-30 收录
下载链接:
https://huggingface.co/datasets/jsisonou/narrative-engine-emotion-5c
下载链接
链接失效反馈
官方服务:
资源简介:
Webnovel叙事情感数据集—5c免费版(研究专用,ARR),包含来自网络小说的情感分析数据。数据集包含五个字段:场景索引、效价(介于-1.0到1.0之间)、唤起度(介于0.0到1.0之间)、主导性(介于0.0到1.0之间)和情感标签(包括喜悦、悲伤、愤怒、恐惧、厌恶、惊讶、信任和预期)。该数据集不含原始文本,仅提供情感分析结果,并且仅限于学术和非商业研究使用。
创建时间:
2025-08-26
原始信息汇总

Webnovel Narrative Emotion — 5c Free (Research-Only, ARR) 数据集概述

数据集基本信息

  • 名称:Webnovel Narrative Emotion — 5c Free (Research-Only, ARR)
  • 状态:活跃
  • 语言:英语
  • 许可协议:JsisOn License (ARR)
  • 标签:仅限研究、非商业、学术、免费、VAD、5c、叙事、情感、时间序列、网络小说、ARR
  • 模式版本:1.5c.open-arr

访问权限

  • 5c层级:开放访问(免费)
  • 7c层级:免费(需申请访问)

数据内容

  • 列数:5列
  • 包含列
    • scene_idx:整数索引(单调)
    • valence:[-1.0, 1.0]
    • arousal:[0.0, 1.0]
    • dominance:[0.0, 1.0]
    • label:{joy, sadness, anger, fear, disgust, surprise, trust, anticipation}

数据样本

scene_idx,valence,arousal,dominance,label 1,0.12,0.55,0.48,anticipation 2,-0.42,0.64,0.51,fear 3,0.58,0.47,0.46,joy

文件结构

  • data/v1_0/vol01/ep001/5c_curve.csv:数据集(5列)
  • schema/public_contract.schema.json:可选机器可读接口
  • LICENSE.txt:JsisOn许可证(ARR,仅限研究,非商业)

许可条款

  • 用途限制:仅限非商业研究和评论
  • 禁止事项:未经明确许可,禁止重新分发、商业用途、训练通用基础模型
  • 联系方式:ai@batalstone.com(合作/许可请求)

引用信息

@dataset{batalstone_emotion_5c_free_arr_2025, author = {Liia Black}, title = {Webnovel Narrative Emotion — 5c Free (Research-Only, ARR)}, year = {2025}, publisher = {JsisOn OÜ} }

搜集汇总
数据集介绍
main_image_url
构建方式
在情感计算与叙事分析交叉领域,该数据集通过系统化采集网络小说情节片段的情感标注构建而成。采用VAD(效价-唤醒度-优势度)三维情感模型与离散情感标签双标注体系,由专业标注团队依据严格协议对叙事内容进行人工情感标注,确保数据的一致性与可靠性。所有原始文本均经过脱敏处理,仅保留数值化情感维度指标与分类标签,既保护版权又符合研究伦理要求。
特点
数据集呈现多维情感表征的独特优势,涵盖效价、唤醒度、优势度三个连续维度及八类离散情感标签,形成互补的情感描述体系。时间序列结构以场景索引为轴心,支持叙事情感弧线的动态分析。数据粒度精细且标注质量统一,特别适合研究叙事演进中的情感波动模式。其非商业研究许可协议为学术探索提供了合规使用框架,同时通过分层数据策略平衡开放性与知识产权保护。
使用方法
研究者可通过标准化CSV格式直接加载情感维度数据,结合时间序列分析方法探索叙事情感演变规律。建议采用滑动窗口技术捕捉情感转移特征,或利用机器学习模型构建情感预测任务。使用前需仔细阅读许可协议,严格遵守非商业研究用途限制。引述研究时请按规范引用格式注明数据来源,如需扩展字段可申请7c层级数据访问权限。
背景与挑战
背景概述
叙事情感计算作为数字人文与计算语言学的交叉领域,近年来受到广泛关注。narrative-engine-emotion-5c数据集由JsisOn OÜ机构于2025年发布,主要研究者Liia Black致力于解决网络小说叙事中情感轨迹的量化分析问题。该数据集通过维度情感模型(VAD)和离散情感标签,为叙事动力学研究提供了时序情感标注框架,显著推动了计算叙事学与情感计算领域的融合发展。
当前挑战
该数据集核心挑战在于解决网络长文本叙事情感连续标注的复杂性,包括跨章节情感强度波动建模和多重情感标签的一致性维护。构建过程中面临标注尺度标准化的技术难题,需平衡VAD三维度与八类离散情感的映射关系,同时确保商业版权约束下非文本元数据的合规性处理,这对情感计算模型的泛化能力提出了更高要求。
常用场景
经典使用场景
在叙事情感计算研究中,该数据集为学者提供了标准化的情感标注框架,通过连续的情感维度(效价、唤醒度、支配度)和离散的情感标签,支持对网络小说叙事结构的情感动态分析。研究者可依据场景索引追踪情感曲线变化,探索叙事节奏与情感起伏的关联性,为计算叙事学提供量化研究基础。
解决学术问题
该数据集有效解决了叙事情感分析中缺乏细粒度标注数据的核心问题,通过VAD三维情感模型与八类基本情感标签的双重标注体系,为情感计算、叙事学、数字人文等领域提供了可靠的研究基准。其标准化格式促进了跨研究的一致性比较,推动了情感计算模型在长文本叙事中的验证与应用。
衍生相关工作
基于该数据集衍生的经典工作包括叙事情感计算模型的对比研究、长文本情感时序预测算法的开发,以及跨媒介情感表达的一致性分析。部分研究进一步结合7c层级数据,探索了情节转折点检测与情感置信度的关联模型,推动了叙事情感计算向细粒度解析方向发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作