Fraser/wiki_sentences
收藏Hugging Face2021-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Fraser/wiki_sentences
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含维基百科中的所有英文句子,来源于OPTIMUS项目。数据集大小为11.8GB,建议使用流式加载。
提供机构:
Fraser
原始信息汇总
数据集概述
数据集名称
- Wiki Sentences
数据集描述
- 包含所有英文维基百科句子的数据集。
数据集来源
- 来自OPTIMUS项目。
数据集大小
- 11.8GB
加载方式
- 推荐使用流式加载以管理大数据集。
python from datasets import load_dataset dataset = load_dataset("Fraser/wiki_sentences", split=train, streaming=True)



