maxidl/no_robots-de
收藏Hugging Face2024-01-19 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/maxidl/no_robots-de
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是HuggingFaceH4/no_robots的德语版本,使用DeepL进行翻译(非正式风格)。数据集中包含prompt、prompt_id、messages_en、category和messages_de等特征,其中messages_en和messages_de是列表类型,包含content和role两个字段。数据集分为train和test两个分割,分别包含9500和500个例子。数据集的下载大小为19860319字节,数据集大小为31936798字节。数据集的许可证为cc-by-nc-4.0,任务类别为text-generation,语言为德语和英语,大小类别为1K<n<10K。
该数据集是HuggingFaceH4/no_robots的德语版本,使用DeepL进行翻译(非正式风格)。数据集中包含prompt、prompt_id、messages_en、category和messages_de等特征,其中messages_en和messages_de是列表类型,包含content和role两个字段。数据集分为train和test两个分割,分别包含9500和500个例子。数据集的下载大小为19860319字节,数据集大小为31936798字节。数据集的许可证为cc-by-nc-4.0,任务类别为text-generation,语言为德语和英语,大小类别为1K<n<10K。
提供机构:
maxidl
原始信息汇总
数据集概述
数据特征
- prompt: 字符串类型
- prompt_id: 字符串类型
- messages_en: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
- category: 字符串类型
- messages_de: 列表类型,包含以下字段:
- content: 字符串类型
- role: 字符串类型
数据分割
- train: 包含9500个样本,占用30309297字节
- test: 包含500个样本,占用1627501字节
数据大小
- 下载大小: 19860319字节
- 数据集大小: 31936798字节
配置
- default: 包含以下数据文件:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
许可
- cc-by-nc-4.0
任务类别
- 文本生成
语言
- 德语 (de)
- 英语 (en)
大小类别
- 1K<n<10K



