five

BookCorpus 大型书籍文本数据集

收藏
超神经2021-01-12 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/13642
下载链接
链接失效反馈
官方服务:
资源简介:
BookCorpus 是一个曾经流行的大型文本语料库,经常用于语句编码/解码的无监督学习。 但是原作者已不再提供 BookCorpus 的下载。

BookCorpus is a once-popular large-scale text corpus that is frequently used for unsupervised learning of sentence encoding and decoding. However, its original authors no longer provide downloads for the BookCorpus dataset.
创建时间:
2020-10-27
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
BookCorpus是一个大型文本语料库,常用于自然语言处理中的无监督学习,其数据主要来源于smashwords.com的免费书籍。该数据集由社区用户贡献,大小为2.24 GB,仅限非商业用途,且原始作者已不再提供下载。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务