five

marekvollmer/txt_dataset_llm

收藏
Hugging Face2024-05-13 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/marekvollmer/txt_dataset_llm
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于语言模型的文本预测数据集,类似于著名的GPT-2。它包含以.txt文件形式存在的文本,目标是预测文本中的下一个词。

该数据集是一个用于语言模型的文本预测数据集,类似于著名的GPT-2。它包含以.txt文件形式存在的文本,目标是预测文本中的下一个词。
提供机构:
marekvollmer
原始信息汇总

数据集概述

基本信息

  • 任务类别:文本生成
  • 语言:英语
  • 名称:英语文本生成数据集,用于语言模型

数据集描述

  • 用途:此数据集用于语言模型(如GPT-2)的文本预测任务,旨在预测文本中的下一个单词。
  • 语言:数据集包含英语文本。
  • 文件格式:文本以.txt文件形式存储。

内容

  • 数据组成:数据集包含一系列德语文本,用于训练语言模型。
  • 组织形式:文本以简单的.txt文件形式组织。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作