five

jnieus01/narrative-arc

收藏
Hugging Face2023-02-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jnieus01/narrative-arc
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于叙事弧(Narrative Arc)的后处理,包含故事的原始文本及其元数据、用于生成嵌入的Transformer模型、模型的检查点、存储嵌入的窗口索引以及嵌入本身。数据集来源于Project Gutenberg图书馆,主要包含英语短篇小说。
提供机构:
jnieus01
原始信息汇总

数据集概述

数据集基本信息

  • 许可证: MIT
  • 数据集名称: narrative-arc
  • 语言: 单语种(英语)
  • 任务类别: 文本分类

数据集结构

数据字段

  • 名称: distilbert-base-cased
  • 数据类型: 字符串

数据分割

  • 训练集:
    • 大小: 32字节
    • 示例数量: 2

数据集创建

源数据

  • 来源: Project Gutenberg[https://www.gutenberg.org/]
  • 语言生产者: 人类作者
  • 数据类型: 英语短故事

数据实例示例

json { "book name": "", "book meta data": "", "full text": "", "model": { "distilbert-base-cased": { "window indices": (first_index, last_index), "embeddings": [[]] },

  "distilbert-base-uncased": {
            "window indices": (first_index, last_index),
            "embeddings": [[]] 
  }
  },

}

数据集使用注意事项

  • 个人和敏感信息: 不适用
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作