marekvollmer/txt_dataset_llm
收藏Hugging Face2024-05-13 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/marekvollmer/txt_dataset_llm
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于语言模型的文本预测数据集,类似于著名的GPT-2。它包含以.txt文件形式存在的文本,目标是预测文本中的下一个词。
该数据集是一个用于语言模型的文本预测数据集,类似于著名的GPT-2。它包含以.txt文件形式存在的文本,目标是预测文本中的下一个词。
提供机构:
marekvollmer
原始信息汇总
数据集概述
基本信息
- 任务类别:文本生成
- 语言:英语
- 名称:英语文本生成数据集,用于语言模型
数据集描述
- 用途:此数据集用于语言模型(如GPT-2)的文本预测任务,旨在预测文本中的下一个单词。
- 语言:数据集包含英语文本。
- 文件格式:文本以.txt文件形式存储。
内容
- 数据组成:数据集包含一系列德语文本,用于训练语言模型。
- 组织形式:文本以简单的.txt文件形式组织。



