marekvollmer/txt_dataset_llm

收藏

Hugging Face2024-05-13 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/marekvollmer/txt_dataset_llm

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个用于语言模型的文本预测数据集，类似于著名的GPT-2。它包含以.txt文件形式存在的文本，目标是预测文本中的下一个词。

该数据集是一个用于语言模型的文本预测数据集，类似于著名的GPT-2。它包含以.txt文件形式存在的文本，目标是预测文本中的下一个词。

提供机构：

marekvollmer

原始信息汇总

数据集概述

基本信息

任务类别：文本生成
语言：英语
名称：英语文本生成数据集，用于语言模型

数据集描述

用途：此数据集用于语言模型（如GPT-2）的文本预测任务，旨在预测文本中的下一个单词。
语言：数据集包含英语文本。
文件格式：文本以.txt文件形式存储。

内容

数据组成：数据集包含一系列德语文本，用于训练语言模型。
组织形式：文本以简单的.txt文件形式组织。

5,000+

优质数据集

54 个

任务类型

进入经典数据集

© 2023-2025 上海数据发展科技有限责任公司版权所有

沪ICP备17003045号-15 沪公网安备31010402336585号

二维码

社区交流群

面向社区/商业的数据集话题

二维码

科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作