five

diltdicker/romance_books_32K

收藏
Hugging Face2022-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/diltdicker/romance_books_32K
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个浪漫小说的数据集,包含书籍的标题、描述和类型。数据集的创建目的是为了构建一个“浪漫小说生成器”。数据集中包含的字段有:`id`(书籍的唯一标识符)、`pub_month`(书籍的出版月份,格式为`YEAR_MONTH`)、`title`(书籍的标题)、`author`(作者的姓名,格式为`last-name, first-name`)、`isbn13`(书籍的13位ISBN号,部分书籍可能没有)、`description`(书籍的描述,可能包含引用的句子或情节简介)、`genres`(书籍的类型标签,字典形式,1表示属于该类型,0表示不属于)。数据集的语言为英语。

--- 许可证:openrail --- 数据集概述 --- 本数据集收录爱情小说,包含`标题(title)`、`内容简介(description)`与`体裁标签(genres)`三类核心字段,旨在构建“爱情小说生成器”。 数据字段 --- - `id`:用于唯一标识数据集中每本图书的整数编号 - `出版月份(pub_month)`:以`YEAR_MONTH`格式标注图书出版月份的字符串 - `标题(title)`:图书的正式标题 - `作者(author)`:以逗号分隔的作者姓名,格式为`姓氏, 名字` - `ISBN13`:图书的13位国际标准书号(注:并非所有图书均配备ISBN编号) - `内容简介(description)`:图书的文本介绍,可包含引用语句、剧情简短预告等内容 - `体裁标签(genres)`:涵盖所有体裁的字典格式字段,其中0代表该图书未被标记为对应体裁,1代表该图书已被标记为对应体裁 - 额外字段:所有独立体裁均被展开为单独字段,并以对应的1或0值完成标记 语言 -- - 英语(en)
提供机构:
diltdicker
原始信息汇总

数据集概述

数据集名称

  • 集合了浪漫小说的数据集,旨在构建一个“浪漫小说生成器”。

数据集内容

  • 包含小说的title(标题)、description(描述)和genres(类型)。

数据字段

  • id : 唯一整数,用于标识数据集中的书籍。
  • pub_month : 字符串,表示书籍出版的月份,格式为YEAR_MONTH
  • title : 书籍的标题。
  • author : 作者姓名,格式为姓, 名
  • isbn13 : 书籍的ISBN号,为13位数字,并非所有书籍都有ISBN号。
  • description : 书籍的文本描述,可能包含引用的句子、简短的情节预告等。
  • genres : 所有类型的字典,0表示书籍未标记该类型,1表示书籍标记了该类型。
  • 额外字段包括所有单独类型的展开,分别对应1和0的值。

语言

  • 英语 (en)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作