BramVanroy/ultra_feedback_dutch_cleaned_multi
收藏Hugging Face2024-03-27 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/BramVanroy/ultra_feedback_dutch_cleaned_multi
下载链接
链接失效反馈官方服务:
资源简介:
Ultra Feedback Dutch Cleaned是一个荷兰语的文本生成数据集,包含多个语言模型的响应,如GEITje-7B-ultra、TowerInstruct-13B-v0.1、TowerInstruct-7B-v0.2、GEITje-7B-chat、gpt-4-turbo和llama-2-13b-chat-dutch。数据集的特征包括这些模型的响应以及提示文本(prompt和prompt_dutch)。数据集分为训练集,包含59885个样本,总大小为624697211字节。这是一个清理过的版本,基于Argilla对原始Ultra Feedback数据集的清理工作。
Ultra Feedback Dutch Cleaned是一个荷兰语的文本生成数据集,包含多个语言模型的响应,如GEITje-7B-ultra、TowerInstruct-13B-v0.1、TowerInstruct-7B-v0.2、GEITje-7B-chat、gpt-4-turbo和llama-2-13b-chat-dutch。数据集的特征包括这些模型的响应以及提示文本(prompt和prompt_dutch)。数据集分为训练集,包含59885个样本,总大小为624697211字节。这是一个清理过的版本,基于Argilla对原始Ultra Feedback数据集的清理工作。
提供机构:
BramVanroy
原始信息汇总
Ultra Feedback Dutch Cleaned 数据集概述
基本信息
- 语言: 荷兰语
- 许可证: CC BY-NC 4.0
- 数据集大小: 10K<n<100K
- 任务类别: 文本生成
- 数据集名称: Ultra Feedback Dutch Cleaned
数据集特征
- 特征列表:
- GEITje-7B-ultra: 字符串
- TowerInstruct-13B-v0.1: 字符串
- TowerInstruct-7B-v0.2: 字符串
- geitje-7b-chat: 字符串
- gpt-4-turbo: 字符串
- llama-2-13b-chat-dutch: 字符串
- prompt: 字符串
- prompt_dutch: 字符串
数据分割
- 训练集:
- 字节数: 624697211
- 样本数: 59885
数据集大小
- 下载大小: 362587024 字节
- 数据集大小: 624697211 字节
配置
- 默认配置:
- 数据文件:
- 分割: 训练
- 路径: data/train-*
- 数据文件:
标签
- 对话式



