SF-Corpus/EF_Full_Texts
收藏Hugging Face2023-05-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SF-Corpus/EF_Full_Texts
下载链接
链接失效反馈官方服务:
资源简介:
SF Nexus Extracted Features Full Texts数据集包含了403本20世纪中叶科幻小说的文本和元数据,这些小说最初来自天普大学图书馆的Paskow科幻小说收藏。数据集中的每一行包含一个文本及其相关的元数据,如标题、作者和出版信息。数据集的语言为英语。
SF Nexus Extracted Features Full Texts数据集包含了403本20世纪中叶科幻小说的文本和元数据,这些小说最初来自天普大学图书馆的Paskow科幻小说收藏。数据集中的每一行包含一个文本及其相关的元数据,如标题、作者和出版信息。数据集的语言为英语。
提供机构:
SF-Corpus
原始信息汇总
数据集概述
数据集名称
- 名称: SF Nexus Extracted Features Full Texts
数据集内容
- 描述: 包含403本20世纪中叶科幻小说的文本和元数据,这些书籍最初由Temple University Libraries的Paskow Science Fiction Collection数字化。
- 处理: 书籍经过数字化后,使用Abbyy FineReader进行清理。
- 版权状态: 由于是受版权保护的小说,书籍已被分解。
- 数据结构: 每行数据包含一段文本及其相关的标题、作者和出版信息。
数据集来源
- 原始收藏: Paskow Science Fiction Collection,主要包含二战后的材料,特别是1964-1980年间的“新浪潮”时期作品。
- 数字化后存储: 数字化文本已被存入HathiTrust的仓库,用于保存和数据管理,可在HathiTrust的Temple页面查看。
语言
- 主要语言: 英语
联系信息
- 联系人: Alex Wermer-Colan



