Rijgersberg/no_robots_nl
收藏Hugging Face2023-12-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Rijgersberg/no_robots_nl
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: test_sft
path: data/test_sft-*
- split: train_sft
path: data/train_sft-*
dataset_info:
features:
- name: prompt
dtype: string
- name: prompt_id
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
- name: category
dtype: string
- name: messages_nl
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: test_sft
num_bytes: 1517416
num_examples: 500
- name: train_sft
num_bytes: 28407005
num_examples: 9500
download_size: 18675565
dataset_size: 29924421
license: cc-by-nc-4.0
language:
- nl
- en
tags:
- GEITje
task_categories:
- conversational
- text-generation
size_categories:
- 10K<n<100K
pretty_name: No Robots NL
---
# Dataset Card for "no_robots_nl"
A translated version of all 10k examples from [HuggingFaceH4/no_robots](https://huggingface.co/datasets/HuggingFaceH4/no_robots).
Automatically translated by GPT-3.5.
## More info
Read more about GEITje-chat, the datasets and the translation code in the [📄 README](https://github.com/Rijgersberg/GEITje/blob/main/README-en.md) on GitHub.
提供机构:
Rijgersberg
原始信息汇总
数据集卡片 "no_robots_nl"
概述
- 数据集名称: no_robots_nl
- 数据来源: 由HuggingFaceH4/no_robots的10k示例自动翻译而来。
- 翻译工具: GPT-3.5
数据集配置
- 默认配置:
- 数据文件:
- 测试集:
data/test_sft-* - 训练集:
data/train_sft-*
- 测试集:
- 数据文件:
数据集信息
- 特征:
- prompt: 字符串类型
- prompt_id: 字符串类型
- messages: 列表类型,包含以下子特征:
- content: 字符串类型
- role: 字符串类型
- category: 字符串类型
- messages_nl: 列表类型,包含以下子特征:
- content: 字符串类型
- role: 字符串类型
- 分割:
- 测试集:
- 名称: test_sft
- 字节数: 1517416
- 示例数: 500
- 训练集:
- 名称: train_sft
- 字节数: 28407005
- 示例数: 9500
- 测试集:
- 下载大小: 18675565
- 数据集大小: 29924421
- 许可证: cc-by-nc-4.0
- 语言: 荷兰语 (nl), 英语 (en)
- 标签: GEITje
- 任务类别: 对话, 文本生成
- 大小类别: 10K<n<100K
- 易读名称: No Robots NL



