BookCorpus 大型书籍文本数据集
收藏超神经2021-01-12 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/13642
下载链接
链接失效反馈官方服务:
资源简介:
BookCorpus 是一个曾经流行的大型文本语料库,经常用于语句编码/解码的无监督学习。 但是原作者已不再提供 BookCorpus 的下载。
BookCorpus is a once-popular large-scale text corpus that is frequently used for unsupervised learning of sentence encoding and decoding. However, its original authors no longer provide downloads for the BookCorpus dataset.
创建时间:
2020-10-27
搜集汇总
数据集介绍

背景与挑战
背景概述
BookCorpus是一个大型文本语料库,常用于自然语言处理中的无监督学习,其数据主要来源于smashwords.com的免费书籍。该数据集由社区用户贡献,大小为2.24 GB,仅限非商业用途,且原始作者已不再提供下载。
以上内容由遇见数据集搜集并总结生成



