hugfaceguy0001/ScifiNovels
收藏Hugging Face2024-04-14 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/hugfaceguy0001/ScifiNovels
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: Full
features:
- name: author
dtype: string
- name: title
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 608352456
num_examples: 5375
download_size: 394908470
dataset_size: 608352456
- config_name: S1
features:
- name: id
dtype: string
- name: category
dtype: string
- name: sub_category
dtype: string
- name: title
dtype: string
- name: author
dtype: string
- name: book_info
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 348474421
num_examples: 4659
download_size: 226839945
dataset_size: 348474421
- config_name: S2
features:
- name: id
dtype: int64
- name: category
dtype: string
- name: sub_category
dtype: string
- name: title
dtype: string
- name: author
dtype: string
- name: book_info
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 368145825
num_examples: 2321
download_size: 238595298
dataset_size: 368145825
configs:
- config_name: Full
data_files:
- split: train
path: Full/train-*
- config_name: S1
data_files:
- split: train
path: S1/train-*
- config_name: S2
data_files:
- split: train
path: S2/train-*
---
提供机构:
hugfaceguy0001
原始信息汇总
数据集概述
配置名称:Full
- 特征:
- author: 字符串
- title: 字符串
- text: 字符串
- 分割:
- 训练集:
- 字节数: 608352456
- 示例数: 5375
- 训练集:
- 下载大小: 394908470
- 数据集大小: 608352456
配置名称:S1
- 特征:
- id: 字符串
- category: 字符串
- sub_category: 字符串
- title: 字符串
- author: 字符串
- book_info: 字符串
- text: 字符串
- 分割:
- 训练集:
- 字节数: 348474421
- 示例数: 4659
- 训练集:
- 下载大小: 226839945
- 数据集大小: 348474421
配置名称:S2
- 特征:
- id: 整数64位
- category: 字符串
- sub_category: 字符串
- title: 字符串
- author: 字符串
- book_info: 字符串
- text: 字符串
- 分割:
- 训练集:
- 字节数: 368145825
- 示例数: 2321
- 训练集:
- 下载大小: 238595298
- 数据集大小: 368145825
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个包含大量科幻小说文本的集合,主要收录了1990年代至2000年代初期的中国科幻作品,包含完整作品和片段,涉及多种科幻主题。数据集以parquet格式存储,包含12,355条记录,总大小约860MB,适合用于自然语言处理和科幻文学研究。
以上内容由遇见数据集搜集并总结生成



