Rijgersberg/ultrachat_10k_nl
收藏Hugging Face2023-12-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Rijgersberg/ultrachat_10k_nl
下载链接
链接失效反馈官方服务:
资源简介:
数据集Ultrachat 10k NL是从HuggingFaceH4/ultrachat_200k中随机选择的10k个样本的翻译版本,使用GPT-3.5自动翻译。该数据集支持荷兰语和英语,主要用于对话和文本生成任务。
数据集Ultrachat 10k NL是从HuggingFaceH4/ultrachat_200k中随机选择的10k个样本的翻译版本,使用GPT-3.5自动翻译。该数据集支持荷兰语和英语,主要用于对话和文本生成任务。
提供机构:
Rijgersberg
原始信息汇总
数据集概述
数据集名称
- Ultrachat 10k NL
数据集来源
- 该数据集是HuggingFaceH4/ultrachat_200k中随机选择的10k示例的翻译版本。
数据集配置
- 默认配置
- 数据文件路径:
- 测试集(test_sft):
data/test_sft-* - 训练集(train_sft):
data/train_sft-*
- 测试集(test_sft):
- 数据文件路径:
数据集信息
-
特征:
prompt:字符串类型prompt_id:字符串类型messages:列表类型,包含以下子特征:content:字符串类型role:字符串类型
messages_nl:列表类型,包含以下子特征:content:字符串类型role:字符串类型
-
数据集分割:
- 测试集(test_sft):
- 字节数:6296981
- 示例数:500
- 训练集(train_sft):
- 字节数:120475850
- 示例数:9500
- 测试集(test_sft):
-
数据集大小:
- 下载大小:65516955
- 数据集大小:126772831
许可证
- CC BY-NC 4.0
语言
- 荷兰语(nl)
- 英语(en)
标签
- GEITje
任务类别
- 对话
- 文本生成
大小类别
- 10K<n<100K
翻译工具
- 自动翻译由GPT-3.5完成



