Falah/deep_learning_books_dataset
收藏Hugging Face2023-07-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Falah/deep_learning_books_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为deep_learning_books_dataset,包含来自深度学习相关书籍的页面文本数据。数据集的特征包括页面编号(page_no)和页面内容(page_content)。数据集分为训练集(train),包含474个样本,大小为1,030,431字节。该数据集适用于多种自然语言处理任务,如文本分类、语言建模、文本生成等。
该数据集名为deep_learning_books_dataset,包含来自深度学习相关书籍的页面文本数据。数据集的特征包括页面编号(page_no)和页面内容(page_content)。数据集分为训练集(train),包含474个样本,大小为1,030,431字节。该数据集适用于多种自然语言处理任务,如文本分类、语言建模、文本生成等。
提供机构:
Falah
原始信息汇总
Deep Learning Books Dataset 概述
数据集信息
特征
page_no: 整数类型 (int64),表示书中的页码。page_content: 字符串类型,表示页面的文本内容。
分割
train: 训练分割。- 示例数量: 474
- 字节数: 1,030,431
大小
- 下载大小: 509,839 字节
- 数据集大小: 1,030,431 字节
数据集应用
该数据集包含与深度学习相关的书籍中各页的文本数据,适用于自然语言处理(NLP)任务,如文本分类、语言模型、文本生成等。



