PG-19
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/PG-19
下载链接
链接失效反馈官方服务:
资源简介:
它包括从古腾堡计划图书库 [1] 中提取的一组图书,这些图书在 1919 年之前出版。它还包含书名和出版日期的元数据。
提供机构:
OpenDataLab
创建时间:
2022-08-11
搜集汇总
数据集介绍

背景与挑战
背景概述
PG-19是一个基于古腾堡计划图书库的英文数据集,收录了1919年之前出版的图书,并包含书名和出版日期等元数据。该数据集由DeepMind和伦敦大学学院于2019年发布,主要用于自然语言处理任务如语言建模和阅读理解。
以上内容由遇见数据集搜集并总结生成



