diltdicker/romance_books_32K
收藏Hugging Face2022-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/diltdicker/romance_books_32K
下载链接
链接失效反馈官方服务:
资源简介:
这是一个浪漫小说的数据集,包含书籍的标题、描述和类型。数据集的创建目的是为了构建一个“浪漫小说生成器”。数据集中包含的字段有:`id`(书籍的唯一标识符)、`pub_month`(书籍的出版月份,格式为`YEAR_MONTH`)、`title`(书籍的标题)、`author`(作者的姓名,格式为`last-name, first-name`)、`isbn13`(书籍的13位ISBN号,部分书籍可能没有)、`description`(书籍的描述,可能包含引用的句子或情节简介)、`genres`(书籍的类型标签,字典形式,1表示属于该类型,0表示不属于)。数据集的语言为英语。
---
许可证:openrail
---
数据集概述
---
本数据集收录爱情小说,包含`标题(title)`、`内容简介(description)`与`体裁标签(genres)`三类核心字段,旨在构建“爱情小说生成器”。
数据字段
---
- `id`:用于唯一标识数据集中每本图书的整数编号
- `出版月份(pub_month)`:以`YEAR_MONTH`格式标注图书出版月份的字符串
- `标题(title)`:图书的正式标题
- `作者(author)`:以逗号分隔的作者姓名,格式为`姓氏, 名字`
- `ISBN13`:图书的13位国际标准书号(注:并非所有图书均配备ISBN编号)
- `内容简介(description)`:图书的文本介绍,可包含引用语句、剧情简短预告等内容
- `体裁标签(genres)`:涵盖所有体裁的字典格式字段,其中0代表该图书未被标记为对应体裁,1代表该图书已被标记为对应体裁
- 额外字段:所有独立体裁均被展开为单独字段,并以对应的1或0值完成标记
语言
--
- 英语(en)
提供机构:
diltdicker
原始信息汇总
数据集概述
数据集名称
- 集合了浪漫小说的数据集,旨在构建一个“浪漫小说生成器”。
数据集内容
- 包含小说的
title(标题)、description(描述)和genres(类型)。
数据字段
id: 唯一整数,用于标识数据集中的书籍。pub_month: 字符串,表示书籍出版的月份,格式为YEAR_MONTH。title: 书籍的标题。author: 作者姓名,格式为姓, 名。isbn13: 书籍的ISBN号,为13位数字,并非所有书籍都有ISBN号。description: 书籍的文本描述,可能包含引用的句子、简短的情节预告等。genres: 所有类型的字典,0表示书籍未标记该类型,1表示书籍标记了该类型。- 额外字段包括所有单独类型的展开,分别对应1和0的值。
语言
- 英语 (
en)



