maxmyn/wholesome_greentext_110k
收藏Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/maxmyn/wholesome_greentext_110k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Short Wholesome 4chan-style Greentext,主要用于文本生成任务。数据集包含111,320个训练样本,每个样本包含一个字符串类型的greentexts特征和一个整数类型的__index_level_0__特征。数据集的许可证允许用户自由使用,但部分数据是通过OpenAI的chatGPT生成的,使用这些数据可能受到OpenAI条款的限制。
该数据集名为Short Wholesome 4chan-style Greentext,主要用于文本生成任务。数据集包含111,320个训练样本,每个样本包含一个字符串类型的greentexts特征和一个整数类型的__index_level_0__特征。数据集的许可证允许用户自由使用,但部分数据是通过OpenAI的chatGPT生成的,使用这些数据可能受到OpenAI条款的限制。
提供机构:
maxmyn
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: 其他
- 大小类别: 100K<n<1M
- 任务类别: 文本生成
- 友好名称: Short Wholesome 4chan-style Greentext
数据集信息
特征
- 名称: greentexts
- 数据类型: string
- 名称: index_level_0
- 数据类型: int64
分割
- 名称: train
- 字节数: 15193164
- 样本数: 111320
大小
- 下载大小: 9449169
- 数据集大小: 15193164
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:
标签
- casual
- internet-culture



