Hyperspace-Technologies/scp-wiki-text
收藏Hugging Face2023-04-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Hyperspace-Technologies/scp-wiki-text
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-4.0
language:
- en
tags:
- scp
size_categories:
- 100M<n<1B
dataset_info:
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 24497718.02277939
num_examples: 314294
- name: test
num_bytes: 2722003.3115220205
num_examples: 34922
download_size: 72410093
dataset_size: 27219721.334301412
---
提供机构:
Hyperspace-Technologies
原始信息汇总
数据集概述
基本信息
- 许可证: cc-by-4.0
- 语言: 英语
- 标签: SCP
- 大小范围: 100M<n<1B
数据集结构
- 特征:
- 名称: text
- 数据类型: string
数据分割
- 训练集:
- 字节数: 24497718.02277939
- 示例数: 314294
- 测试集:
- 字节数: 2722003.3115220205
- 示例数: 34922
下载与数据集大小
- 下载大小: 72410093
- 数据集大小: 27219721.334301412
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是SCP Wiki的文本集合,包含大量虚构的SCP基金会文档、故事和实验记录,主要用于自然语言处理任务。数据集规模较大,有约349,000行文本,以英语编写,采用CC-BY-4.0许可证开放使用。
以上内容由遇见数据集搜集并总结生成



