five

maxidl/no_robots-de

收藏
Hugging Face2024-01-19 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/maxidl/no_robots-de
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是HuggingFaceH4/no_robots的德语版本,使用DeepL进行翻译(非正式风格)。数据集中包含prompt、prompt_id、messages_en、category和messages_de等特征,其中messages_en和messages_de是列表类型,包含content和role两个字段。数据集分为train和test两个分割,分别包含9500和500个例子。数据集的下载大小为19860319字节,数据集大小为31936798字节。数据集的许可证为cc-by-nc-4.0,任务类别为text-generation,语言为德语和英语,大小类别为1K<n<10K。

该数据集是HuggingFaceH4/no_robots的德语版本,使用DeepL进行翻译(非正式风格)。数据集中包含prompt、prompt_id、messages_en、category和messages_de等特征,其中messages_en和messages_de是列表类型,包含content和role两个字段。数据集分为train和test两个分割,分别包含9500和500个例子。数据集的下载大小为19860319字节,数据集大小为31936798字节。数据集的许可证为cc-by-nc-4.0,任务类别为text-generation,语言为德语和英语,大小类别为1K<n<10K。
提供机构:
maxidl
原始信息汇总

数据集概述

数据特征

  • prompt: 字符串类型
  • prompt_id: 字符串类型
  • messages_en: 列表类型,包含以下字段:
    • content: 字符串类型
    • role: 字符串类型
  • category: 字符串类型
  • messages_de: 列表类型,包含以下字段:
    • content: 字符串类型
    • role: 字符串类型

数据分割

  • train: 包含9500个样本,占用30309297字节
  • test: 包含500个样本,占用1627501字节

数据大小

  • 下载大小: 19860319字节
  • 数据集大小: 31936798字节

配置

  • default: 包含以下数据文件:
    • train: 路径为data/train-*
    • test: 路径为data/test-*

许可

  • cc-by-nc-4.0

任务类别

  • 文本生成

语言

  • 德语 (de)
  • 英语 (en)

大小类别

  • 1K<n<10K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作