five

SF-Corpus/EF_Full_Texts

收藏
Hugging Face2023-05-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SF-Corpus/EF_Full_Texts
下载链接
链接失效反馈
官方服务:
资源简介:
SF Nexus Extracted Features Full Texts数据集包含了403本20世纪中叶科幻小说的文本和元数据,这些小说最初来自天普大学图书馆的Paskow科幻小说收藏。数据集中的每一行包含一个文本及其相关的元数据,如标题、作者和出版信息。数据集的语言为英语。

SF Nexus Extracted Features Full Texts数据集包含了403本20世纪中叶科幻小说的文本和元数据,这些小说最初来自天普大学图书馆的Paskow科幻小说收藏。数据集中的每一行包含一个文本及其相关的元数据,如标题、作者和出版信息。数据集的语言为英语。
提供机构:
SF-Corpus
原始信息汇总

数据集概述

数据集名称

  • 名称: SF Nexus Extracted Features Full Texts

数据集内容

  • 描述: 包含403本20世纪中叶科幻小说的文本和元数据,这些书籍最初由Temple University Libraries的Paskow Science Fiction Collection数字化。
  • 处理: 书籍经过数字化后,使用Abbyy FineReader进行清理。
  • 版权状态: 由于是受版权保护的小说,书籍已被分解。
  • 数据结构: 每行数据包含一段文本及其相关的标题、作者和出版信息。

数据集来源

  • 原始收藏: Paskow Science Fiction Collection,主要包含二战后的材料,特别是1964-1980年间的“新浪潮”时期作品。
  • 数字化后存储: 数字化文本已被存入HathiTrust的仓库,用于保存和数据管理,可在HathiTrust的Temple页面查看。

语言

  • 主要语言: 英语

联系信息

  • 联系人: Alex Wermer-Colan
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作